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MOLECULES D'ACIDES NUCLEIQUES CODAWT UNE DEXTRANE- 

SACCHARASE CATALYSANT LA SYNTHESE DE,DEXTRANE 
PORTANT DES RAMIFICATIONS DE TYPE ALPHA-1.2 OSIDIQUES 

5 

La presente Invention releve du domaine de la 
glycotechnologie et plus particulierement de la synthese d'oligosaccharides 
ou oligosides a effet prebiotique. therapeutique ou diagnp^tlque. 

La presente invention porte sur des molecules d'acldes 

10 nuclelques codant une enzyme ayant une actlvite de glycosyltransf6rase 
catalysant la synthesQ de dextranes ou d'oligosides portant des 
ramifications de type a(1 2) osidiques. 

L*invention porte en outre sur les enzymes synth6tis6es par 
les acides nucleiques selon rinventlon, ainsi que sur leurs systemes 

15 d'expression dans des cellules procaryotes ou eucaryotes. Elles portent 
enfin sur rutiiisation desdites enzymes dans la production 
d'oiigosaccharides dans Talimentation, ou en tant que principe actif de 
produits th§rapeutiques et/ou cosmetiques. 

Les oligosides et h6t§rooligosides jouent le role de signaux de 

20 reconnaissance et d*effecteur chez Tanimal comme dans les plantes (on 
parle alors d'oligosaccharines), en se llant specifiquement a des lectines, 
des giycosyltransferases, des glycosidases, des molecules d'adhesion, 
etc, Ainsi, les determinants antigenlques des groupes sanguins sont des 
osides, et notre defense centre nombre de bacteries pathogenes est dirigee 

25 centre les structures osidiques de Tenveloppe bacterienne. Par ailleurs. 
I'une des raispns majeures du rejet des x6nogreffes est Texistence de 
structures osidiques propres a chaque espece. Ces proprietes, ainsi que 
les connaissances acquises ces dernieres annees sur les 
giycosyltransferases et les lectines, contribuent a faire de certains 

30 oligosides des candidats de choix pour la therapeutique ou la prophyiaxie 
des desordres lies a Tequilibre microbiologique de differents organes tels 




2 



rintestin, ou la peau. Par exemple, !es oligosides constituent une alternative 
int6ressante a Tutilisation de microorganismes et d'antibiotiques pour 
reguler !a composition de la flore intestinale (effet prebiotique). Certains 
oligosides peuvent §tre consider6s comme des "fibres solubles" lorsqu'ils 
5 ne sont pas metabolises par les enzymes digestives humaines et 
animales ; en gagnant le colon, ils interagissent avec la ffore microbienne et 
affectent specifiquement la croissance et I'adhesion de certaines especes. 
Incorporees a faible dose (moins de 1 %) dans ralimentation, certaines de 
ces molecules osidiques am§liorent r§tat de sant^ et stimulent la prise de 
10 poids des animaux. 

Une revue des diff^rentes glycosyltransf^rases, leur structure 
et leur activlte, est decrite dans Vincent Monchois et al. (1). Brievement : 

a) II apparait que la structure des glycosyltransferases et/ou 
dextrane-saccharases etudiees est tres conservee et est constituee, 

15 partant de la partie aminee de la proteine. d'une sequence signal, d'un 
domaine variable, d'un domaine catalytique et d'un domaine de liaison au 
glucane. 

b) Les glucoollgosides (GOS) sont synthetisables par des 
glycosyltransferases telles les dextrane-saccharases, a partir de substrats 

20 peu coQteux tel le saccharose et en presence d'un sucre accepteur de 
glucose. D'autres substrats. tels ra-D-fluoro-glucose, le paranitrophenyl-a- 
D-glucopyranoside, Ta-D-glucopyranoside-a-D-sorbofuranoside ou le 4-0- 
a-D-galactopyranosylsucrose peuvent egalement etre utilises. 

Ces enzymes catalysent a partir du substrat le transfert 

25 d'unites glucose sur des molecules acceptrices. En presence d'un 
accepteur de glucose tei le maltose, ou Tisomaltose, les 
glycosyltransferases catalysent la synth§se d'ollgosaccharides de bas 
polds mol§culaire comprenant majoritairement des chaTnes de 3 a 7 
glucoses, selon la reaction : 

30 saccharose + accepteur ► accepteur glucosyle + fructose 



En pareil cas. les enzymes presentent gen^ralement une 
sp6cificite de synthese de liaisons osidiques confonnes a celle fomnant le 
polymere donneur. 

En revanche, en absence d'accepteur. Tenzyme synthetise 
5 des giucanes de haut poids moleculaire de type dextrane par transferts 
successifs d'unit^s a-D-glucopyranosyles a partir de saccharose, 
conformement a la reaction : 

n saccharose 5> {glucose)n + n fructose 

c) Les structures et la fonction des giucanes ou des oligosldes 
10 synth§tises par les glycosyltransferases dependent de la souche 
bacterienne productrice. . 

Dans {'ensemble de ce texte, on appellera de ^^on generique 
des glycosyltransferases les differentes enzymes capables de catalyser la 
synthese de polymeres de glucose a partir de saccharose. Elles sont 
15 generalement produites par des souches bacteriennes de type 
Leuconostoc, Lactococcus, Streptococcus ou Neisseria, La taille et la 
structure des giucanes produits dependent de la souche productrice. 

Les unites de glucose sont coupl^es par des liaisons 
osidiques a(1-^-6) comme dans le dextrane, par des liaisons a(1-»3), 
20 comme dans le cas du mutane. ou par une alternance des deux types 
(alternane). 

De la meme fajon, I'existence et la nature des ramifications, 
leur longueur et leur position varient seion I'origine de la souche 
productrice. 

25 Les glycosyltransferases produisant des giucanes ou des 

GOS contenant aii moins 50 % de liaison a(1--»6) sont appelees dextrane- 
saccharases. Le^ GOS synthetises par ces enzymes portent, le cas 
ech^ant, des ramifications a(1-»'2). a(1->3) et/ou a(1-^4). Lesdites 
dextrane-saccharases sont produites notamment par des bacteries de type 

30 Leuconostoc mesenteroides. 



d) La dextrane-saccharase de L mesenteroides NRRL B- 
1299 a la particularite de produire, quant a elle. un dextrane hautement 
ramlfie dont la majorite des ramifications sont de type a(1^2). Utilis§e en 
presence de saccharose et de maltose, molecule acceptrice de glucose, 
elle conduit a la fonnation de GOS presentant pour certains une liaison 
(xO-^l) a leur extremite non reductrice et pour d'autres des ramifications 
a(1-H^2) sur les r^sldus intermediaires entre les extremites. A ce titre, ils 
resistant a la degradation par les enzymes (hydrolases), du tractus digestif 
superieur, chez Thomme et ranimal, et ne sont degrades que par des 
genres bacteriens capables de fermenter tels Bactemides et 
Biffdobactenum, considires comme ben^fiqu^s pour I'organisme de I'hote. 

Un ph^nomene identique se produit au niveau de la peau, 
permetlant d'envisager des applications en cosmetologie, car c'est le 
desequilibre de la flore microbienne cutanee qui est a Torigine de nombreux 
problemes cosmetiques et dermatologiques. C'est en raison de ces 
caracteristiques qu'ils sont designes ici par le terme GOS dMnteret. 

Dans Tensemble du texte, les polysaccharides synthetisds par 
les glycosyltransf^rases seion Tinvention sont soit des dextranes de haut 
poids moleculaire lorsque la reaction est r^alisee sans accepteur de 
glucose, soit des oligosides lorsque la r6action est r6alis§e en presence 
d'accepteur de glucose tel le maltose ou I'isomaltose sans que cela soit 
necessairement specifie. En effet. la fonctionnalite de Tenzyme est 
caracterisee par la nature des liaisons glucose-glucose [a(1->6), a(1-»2)l 
ou autres et non par le poids moleculaire du polysaccharide synthetise. 

Les dextrane-saccharases de L. mesenteroides trouvent deja 
de nombreuses applications dans Hndustrie. et en particulier celles de la 
souche NRRL B-1299 pour lesquelles un proc^de de synthase des GOS 
pr^sentant des ramifications a(1->2) a ete decrit dans le brevet 
EP 0325 872 B1. 

Marguerite Dols et al. (2) ont montre que les GOS produits par 
les dextrane-saccharases de cette souche sont en fait un melange d'au 



moins trois families de molecules simiiaires differant de fait par le nombre 
et ie positionnement des ramifications de type a(1->'2), ce qui amene 
rhypoth^se de Fexistence de differentes activites enzymatiques de type 
glycosyltransferase dans cette souche bacterienne. 
5 Compte tenu de I'interet industriel dans le domains des 

aliments prebiotiques, en cosmetoiogie ou en pharmade ' des ' GOS 
presentant des ramifications a(1--^2) et rappeie ci-dessus, la presente 
invention vise a isoler et caracteriser une enzyme particuliere parmi celles 
produites par :L mesenterqides NRRL B-1299 qui serait plus 

10 particulierement impliquee dans la synthase d'oligosides presentant les 
ramification a(1->2). Lidentification et la caracterisation d'une telle enzyme 
offrent I'avantage, d*une part, de foumir un precede de production unlforme 
et repnxluctible des GOS d'interdt et, d'autre part, d'identifier les 
caracteristiques essentielles de Tenzyme productrice de ces GOS d1nteret» 

15 afin, le cas echeant, d'ameliorer les performances des produits de la 
reaction enzymatique en fonction de Tutillsation envisages. 

Le probleme technique sous-tendu dans la presente invention 
etait ainsi de pouvoir disposer d'une enzyme et done des acides nucl^iques 
isoles codant cette enzyme permettant la production am6!ior6e de GOS a 

20 ramfficatlons a(1->'2). 

La presente invention apporte une solution technique aux 
differentes questions evoquees cl-avant en fournissant une nouvelle 
dextrane-saccharase, appelee DSR-E codee par un gene dote d'une 
structure nouvelle et inattendue (dsrE) et capable de catalyser la synthese 

25 des glucanes ou des oligosaccharides contenant des ramifications a(1->-2). 

Entre la date de depot de la demande de brevet frangais 
N°0 103631, dont la priorite est revendiqu§e et dans laquelle la dextrane- 
saccharase objet de invention etait appelee DSR-D, et celle de ia pr6sente 
demande. une autre dextrane-saccharase, differente de Tenzyme objet de 

30 rinvention, a ete decrite et egaiement nommee DSR-D. Cast pourquoi, 
dans le cadre de la presente demande de brevet, la dextrane-saccharase 
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decrite, revendiqu^e et representee a la figure 1b) est denommee non plus 
DSR-D comme dans ie document de priority, mais DSR-E. De fait, les 
dextrane-saccharases DSR-D selon ledit document de priorlte et DSR-E 
sont en tout point identiques. 

5 Par structure nouvelle et inattendue, on entend le fait que 

I'organisation de la proteine differe de celle de toutes les autres 
glycosyltransferases decrites a ce jour (1) et dont le domaine catalytique 
est situe en amont d'un domaine de liaison au glucane. ce dernier 
constituant la partie carboxyiique de ia proteine. 

10 Ainsi, la presente Inventibn porte sur un polypeptide isole 

ayant une activite enzymatique de glycosyltransf^rase apte a fonner des 
dextranes pr^sentant des ramification's a{1-»2). caract6ris6 en ce qu'il 
comprend au moins un domaine de liaison au glucane et un domaine a 
activity catalytique situe en aval du domaine de liaison au glucane. Par 

15 situe en aval, on entend le fait que la partie aminee de ia sequence a 
activite catalytique ou domaine catalytique est proximale de la partie 
carboxyiique du domaine de liaison au glucane. Ces deux domaines 
peuvent §tre immedlatement contigus ou au contraire separ^s par une 
region variable. 

20 La glycosyltransferase selon Tinvention comporte de 

preference un peptide signal. 

Dans un mode de realisation de I'lnvention, la 
glycosyltransferase comprend deux domaines catalytiques situds de part et 
d'autre du domaine de liaison au glucane. 

25 La presence d*un domaine d activite catalytique dans la partie 

carboxyiique de Tenzyme est une caract^ristlque essentielle de cette 
derniere dans sa capacite a former des liaisons a(1->2) osidiques. En effet, 
comme le montrent les experiences decrites ci-apres. la deletion de ce 
domaine dans une enzyme ayant au moins deux domaines catalytiques 

30 conduit a la production de glucanes ou d'oligosides ayant essentiellement 



des liaisons osidiques de type a{^-^) et depourvus de liaisons de type 
a(1-^2). ; 

Plus pr^cisement. !e domaine catalytlque, d§s lors qu'il est 
situe en aval d'un domaine de liaison au glucane, pemriet la synthese 
d'oligosides contenant des liaisons a(1->2). 

En outre, les experiences decrites ci-apres demontrent que la 
specificite de fonction de la dextrane-saccharase DSR-E, a savoir sa 
capacite a cataiyser la formation de liaisons osidiques a(1-»2) est 
imputable, non pas a la presence concomitante de deux domaines 
catalytiques. rnais plutdt a TenchaTnement d'un domaine de liaison au 
glucane et d'un domaine catalytique. et plus, particulierement du domaine 
catalytique CD2. 

L'analyse comparative des differentes glycosyltransferases 
incluant les dextrane-saccharases a mis en evidence un tres fort degre de 
conservation de leur domaine catalytique. 

Le domaine catalytique situe dans la partie carboxy-terminale 
de la glycosyltransMrase selon Tinvention a une sequence pr§sentant au 
moins 44 % d'identit6 et 56 % de simllarite avec les domaines catalytiques 
des autres glycosyltransferases analysees. En particulier, le domaine 
catalytique daris la partie carboxyiique de la glycosyltransferase selon 
invention a au moins 65 % d'identite et au moins 80 % de similarite avec la 
sequence ID No. 1, la triade catalytique Asp/Glu/Asp en positions 
respectives 230/268/342 etant conservee, 

Dans Tensemble du texte, on entend par X% de similarite par 
rapport a une sequence de reference le fart que X % des acides amin§s 
sont identiques ou modifies par substitution conservative telle que definie 
dans le logiciel d'alignement des sequences d'acides amines ClustalW 
fhttp:///bio web.pasteur.fr/docs/doc~qensoft/clustalw//^ et que (100-X) % 
peuvent etre deletes, substitues par d'autres amino-acides, ou encore que 
(100-X) % peuvent etre ajoutes a la sequence de reference. Une structure 
primaire particuliere de Tenzyme selon invention est representee dans la 
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sequence ID No. 2 qui represents une s6quence de 2835 acides amines 
d'une dextrane-saccharase de L. mesenteroides NRRL B-1299. 

Cette dextrane-saccharase. nommSe DSR-E. possede 
comme la plupart des glycosyltransferases et des dextrane-saccharases 
une sequence signal, une region variable faiblement conservee. un 
domaine catalytique hautement conserve (CD1), un domaine de liaison au 
giucane (GBD) et un deuxieme domaine catalytique (CD2) dans la partie 
carboxylique de la prot^ine. DSR-E est la premiere glycosyltransferase 
analysee et presentant deux domaines catalytiques. dans la configuration 
pr^sent^e dans la figure 1 b). C'est 6galement la premiere 
glycosyltransferase dont un domaine catalytique est situ6 dans la partie 

carboxylique de la prot6ine. 

La figure 1b) felt apparaTtre dgalement que le domaine de 

liaison au giucane est sensiblement plus long que celui decrit 
15 precedemment pour les dextranes saccharases connues ; ainsi, une autre 

caracteristique des enzymes selon Tinvention est lateille de ce domaine qui 

est superieur a 500 amino-acides. 

La comparaison et Fanalyse de la sequence de DSR-E avec 

les sequences des glycosyltransferases ou des dextrane-saccharases deji 
20 d§crites (1). ainsi que les moyens utilises a cette fin sont indiques dans 

I'exemple2 d6tallte ci-apres. II y apparatt clairement que si I'existence de 

deux domaines catalytiques differencie substantiellement DSR-E des 

autres enzymes, en revanche les sequences desdits domaines sont 

substantiellement conservees. En particuller. les acides amines 
25 necessaires & I'activitS catalytique sont conserves dans le deuxidme 

domaine catalytique. i savoir la triade Asp/Glu/Asp situ6e aux positions 

respectives 2210/2248/2322 de la sequence ID No. 2. 

Ainsi, I'inventlon porte egalement sur tout polypeptide isol6 

ayant une activite catalytique de glycosylstransferase apte a former des 
30 dextranes ou des oligosaccharides ayant des ramifications a(1^2) tel 

qu'obtenu par modification, substitution, insertion ou d61§fion de sequences 
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d'amino-acides mais comportant des sequences presentant au moins 80 % 
et de preference au moins 90 % de simiiarite avec les sequences suivantes 
de la sequence ID No. 2 : 

423-439 2120-2138 
5 478-501 ^ * 2161-2184 

519-539 2202-2214 
560-571 ' 2243-2250 
631 -645 2315-2322 
1014-1021 ■ 2689-2696 

10 

De fagon pr^feree. enfin, un polypeptide § activite catalytique 
selon i'inventibh co'ntient les acides amines suivants : 
W en positions 425 et 2122, 
E en positions 430, 565 et 2127. 2248, 
15 D en positions 487, 489. 527. 638. 2170, 2172. 2210 et 

2322, 

H en position 637 et 2321 , 
Q en position 1019 et 2694, 
Les polypeptides a activite de glycosyltransferases aptes a 

20 former des liaisons osidiques a(1^2) peuvent se presenter sous forme 
isolee, ou au contraire integres dans une proteine plus large, comme par 
example une proteine de fusion, II peut etre en effet avantageux d'inclure 
des sequences presentant une autre fonction, comme par example une 
sequence etiquette specifique d'un ligand permettant d'en faciliter ia 

25 purification. Ces sequences etiquettes peuvent *§tre du type GST 
(glutathion-S-Transferase). Inteine - CBD (Chitine-Binding Domaine). 
(commercialise par New England Biolabs, http://www.neb.com), MBD 
(Maltose Binding Domain), polypeptides contenant des residus histldine 
contigus permettant de faciliter la purification du polypeptide avec lequel ii 

30 est fusionn^. L'homme du metier peut concevoir toute autre proteine de 

fusion permettant d'assocler la fonction de la DSR-E de I'invention avec 
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une autre fonction, comme par example, et sans etre lim'rtatif, una 
sequence augmentant la stabilite de I'enzyme produite par expression dans 
un h6te recombinant ou une sequence apte a augmenter la specificite ou 
refRcacite d^action de cette enzyme, ou une sequence visant S associer 

5 une autre activite enzymatique connexe. 

De felles proteines de fusion font egalement partle de 
rinvention des lors qu'elles contiennent ie domarne CD2 et le site de liaison 
au glucane. De ia meme fa9on, les fragments de la sequence ID No. 2, 
comprenant au moins la sequence ID No. 1 et le domalne de liaison au 

10 glucane, seuls ou !nt§gres dans une sequence polypeptidique plus large 
font partie de rinvention, a partir du moment oCi Tactivite enzymatique de 
dextrane-saccharase est conserv^e. 

Les variants des sequences polypeptidiques deflnies ci- 
dessus font egalement partie de rinvention. Outre les polypeptides obtenus 

15 par substitution conservative des acides amines telle que definie plus haut, 
les variants incluent des polypeptides dont Tactivite enzymatique est 
am^lioree par exemple par mutagendse dirig^e ou al§atoire, par evolution 
mol^culaire, ou par duplication du domaine catalytique CD2. 

La structure particuliere de cette enzyme identifiee dans la 

20 pr^sente invention resufte d'un processus comprenant : 

a) ridentificatlon et I'isolement de la dextrane-saccharase de 
L mesenteroides catalysant la production des GOS d'interet portant les 
ramifications a(1-->2) ; 

b) le sequen9age de fragments de Tenzyme ; 

25 c) la synthase d*amorces d'amplification aptes a amplifier le 

gene correspondant de la souche productrlce ou des fragments de ceux-ci ; 

d) le sequengage des fragments amplifies ; 

e) le clonage dans des vecteurs sp^cifiques et leur expression 
dans des hotes approprles. 

30 Les modalites du precede mis en oeuvre sont detaillees dans 

la partie experimentale ci-apres. La premiere etape consiste en une 
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separation des prot^ines par 6lectrophorese en gel de polyacrylamide, et 
identification des bandes pr6sentant ractivit6 de dextrane saccharase par 
une reaction en2ymatique in situ en presence de substrat et d'accepteur. 
La nature des GOS synthetises est ensuite identifiee sur chaque bande par 
5- analyse HPLC selon ies methodes decrites dans (1). Le temps de retention 
des oligosides en HPLC depend de la'nature et de I'organisation de leurs 
liaisons osidlques. II est possible en particulier de distinguer ceiix 
constitues de residus lies en a(1-^6), en a(W6) avec une ramification 
a(i^2) a l'extr§m)te non reductrice de la molecule, et ceux recherclies 
10 composes d'une chaTne lineaire a(1-^6) avec des ramifications a(1^2). 

Les inventeurs ont done isole et identifi§ la dextrane- 
saccharase de L mesenteroides NRRL B-1299 productrice des GOS 
d'inter§t. 

Un precede dMngenierie reverse mis en oeuvre dans ies 

15 etapes b) a e) cl-dessus a permis ensuite de fournir la sequence 
nucleotidique codant Tenzyme et permettant de la produire en quantite 
industrieile et le cas ech^ant de la modifier, d'en ameliorer ses 
performances par les techniques a la disposition de Thomme du metier. A 
titre d'exemple, on peut citer la mutagenese dirig6e ou al^atolre, ou 

20 revolution moleculaire (DNA shuffling) (3). 

Un autre aspect de {'invention porte sur une molecule d*acide 
nucleique isolee codant une enzyme a activite giycosyltransferase apte a 
former des dextranes ou des oligosides presentant des ramifications 
a(l-^2) et comprenant au moins une sequence codant un domaine de 

25 liaison au glucane, et au moins unfe sequence nucleotidique codant uh 
domaine catalytique situ^ en 3* de la precedente, ladite sequence codant 
un domaine catalytique ayant au moins 50 % et de preference au moins 
70 % de similarite avec la sequence ID No. 3. 

Par similarite, on entend le fait que, pour un meme cadre de 

30 lecture, un triplet donne est traduit par le meme acide amine. Ce femne 
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inclut done les modifications de bases resultant de la degenerescence du 

code genetique. 

Le pourcentage de similarity est detemiine en comparant une 

sequence donn6e avec la sequence de r§f§rence. Lorsque cel!es-ci sont de 
5 longueurs differentes, le pourcentage de similarite est base sur le 

pourcentage de nucleotides de la sequence la plus courte similaires a ceux 

de la sequence la plus longue. 

Le degre de similarite peut etre determine 

conventionnellement par utilisation de logiciels teis le ClustalW (Thompson 
10 et a/.. Nucleic Acid Research (1994). 22 : 4673-4680) distribu6s par Julie 

Thompson (Thompson@EMBL-Heidelbero.DE) et Toby Gibson 

rGibson(g>EMBL-Heidelberq.DE) du Laboratoire Europ6en de Biologie 

Moieculaire, Meyerhosfetrasse 1, D-69117 Heidelberg. Germany. ClustalW 

peut aussi etre chaise a partir de plusieurs sites web incluant IGBMC 
15 (Institut de Gen§tique et de Biologie Moleculaire et Cellulaire, BP. 163, 

67404 lllkirch cedex France; ftp://ftD-lqbmau-strabq.fr/pubA et EB! 

(ftp://ftp.ebi.ac.uk/pub/software/) et tous les sites renvoyant a Tlnstitut de 

Bioinfonnatique (Wellcome Trust Genome Campus, Hinxton. Cambridge 

CB10 1SD. UK). 

20 Les acides nucleiques Isolds selon Tinvention peuvent 

comprendre notamment d'autres sequences destinies a ameliorer 
Texpression et/ou I'activite de Fenzyme produite, 
11 peut s'agir a titre d'exemple : 

- des sequences codant une sequence signal pour leur 

25 secretion ; 

- une duplication de la sequence codant le domaine 
catalytique CD2. 

De fagon prefer§e. un acide nucleique isol6 selon Tinvention 

comprend : 



a) deux sequences codant des domaines catalytiques ayant 
au moins 50 %, et de preference au moins 80 % de similarity avec la 
sequence ID n*" 3 ; • 

b) une sequence codant le domalne de liaison au gtuciane, 
cette demi^re efant s'rtuee de pr§f§rence entre les deux sequences en a). 

Un acide nucl^ique selon rinvehtioh pourra comprendre en 

outre : 

- un promoteur, apte a son expression dans une cellule hote 

choisie, 

- une sequence codant un peptide signal, et/ou 
" une t)U des sequences variables, 

cette' 6u ces s§quence(^) §tant toutes situ6es en partie 5' des 
sequences codant le ou les domaine(s) catalytique{s). 

Un exemple particulier d'un acide nucl^ique isole selon 
rinvention comprend plus particulierement : 

a) la sequence ID No. 4» 

b) une sequence presentant au moins 80 % de similarite avec 
la sequence ID n° 4, ou 

c) le brin complementaire de la sequence a) ou b). ou 

d) une sequence hybridant a), b) ou c). 

L'hybridation en d) est r§aiisee en conditions standard, et de 
preference en conditions stringentes. Par hybridation en condition 
stringente, on entend le fait qu'il existe une identite de sequences d'au 
moins 80 % de la sequence que Ton cherche a hybrider et de preference 
une Identity d'au rinoins 90 % de la sequence que Von cherche a hybrider. 
dans des conditions decrites par exemple dans Sambrook et Russel 
(3^^ Edition, 2001, Cold Spring Harbour Laboratory Press. Cold Spring 
Harbour. NY), 

LMnvention porte egalement sur un gene codant une dextrane- 
saccharase apte a former au moins 15 % de ramifications a(1->2). Outre la 
sequence codante, le gene comprend les sequences permettant I'initiatlon 
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de la transcription ainsi que les sequences permettant I'attachement de 
TARN messager au ribosome (RBS). La sequence ID No. 5 represente une 
structure du g§ne te! qu'iscfe de L mesentervides NRRL B-1299. 

Les nucleotides en amont de TATG d'initiatlon de la traduction 
5 sont numerotes 1 a 232. 

On peut identifier Texistence d'une sequence RBS entre les 
nucleotides 218 et 223, ainsi que les sequences consensus -35 et - 10 
situees entre ies nucleotides 82 et 86 (TTGAA), d'une part et 100 et 105 
(ATAAAT), d'autre part. 

10 Toute sequence d'acide nucleique hybridable avec I'ADN de 

la s6quence ID No. 4 ou son brin complementaire est susceptible de coder 
une enzyme ayant les propri§tes et caract6ristiques de I'enzyme selon 
{'invention. Ceci s'applique tant aux sequences naturelles existant dans 
d'autres micro-organismes que L. mesenteroides NRRL B-1299 et isolees 

15 de banques genomiques de microorganlsmes, que celles preparees par 
genie genetique ou par synthese chimique. 

En particulier, ies sequences en amont de I'ATG d'initiation de 
la traduction et necessaires § Texpression de la proteine peuvent etre 
avantageusement substitutes par des sequences d'initiatfon de !a 

20 transcription et/ou de fixation au ribosome adaptts au systdme 
d'expression choisi pour la sequence codante. 

Une sequence d^acides nucleiques susceptible de s'hybrlder 
en condition stringente avec I'acide nucleique isole selon {'invention 
comprend egalement des fragments, des derives, ou des variants alfeiiques 

25 de la sequence d'acides nucleiques selon invention qui code une proteine 
ayant Tactivite enzymatique decrite ci-avant. Ainsi, Ies fragments sont 
definis comme des fragments de molecules d'acides nucleiques 
suffisamment longs pour coder une proteine ayant conserve son activite 
enzymatique. Celle-ci inclut aussi bien des fragments depourvus de la 

30 sequence codant le peptide signal responsable de la secretion de la 
proteine. 
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Le terme "derive" signifie sequence, diff^rente de ta sequence 
originelle, a une ou piusieurs positions, mais presentant un haut degre de 
similarity avec ces sequences. Dans ce contexte, similarite signifie une 
identite d'au moins 80 % des nucleotides, et de preference d'au moins 
5 90 % avec la sequence originelle. Les modifications* dans ce cas portent 
sur des deletions, substitutions, insertions ou recombinalsons, a partir du 
moment ou I'enzyme codee par ces sequences homologues presentent 
Tactivite enzymatique des polypeptides selon {'invention. 

Les sequences d'acides nucl§iques selon I'invention telles que ' 

10 d^crites ci-dessus et qualifi6es de d^riv^s de ces molecules telles que 
definies ci-avant, sont gen^ralement des variants exer^ant la m§me 
fonction biologique. Ces variations peuvent etre des variations naturelles, 
notamment celles observables d'une espece a I'autre et resultant d'une 
variabilite inter espece ou au contraire etre introduites par le moyen d'une 

15 mutagenese dirigee, aleatoire ou par DMA Shuffling (evolution moleculaire). 

De la m§me fagon, font partie de {'invention les acides 
nuclelques isoles codant une glycosyltransferase apte a catalyser la 
synthese de dextrane ou d'oligosaccharide portant au moins 20 % et de 
pr6ference au moins 30 % de ramifications de type a(1^2) et obtenus par 

20 evolution mo{ecu!alre (DNA shuffling) et comprenant : 

- une etape de modification aleatoire d'une des sequences 
decrites precedemment et, en particulier, des sequences ID Nos. 3 et 4 et 
d'etablissement de variants ; 

" une ytape d'expression de ces sequences modifiees dans 
25 une cellule hote appropriee, un hdte abritant un Variant 

- une etape de criblage des Hdtes exprimant une enzyme apte 
a fonner plus de 20 % et de preference plus de 30 % de liaisons a(1 -» 2) 
sur un substrat appropri§ et One etape d'isolement du ou des genes 
arneliores. 

30 Un acide nucleique isole selon I'invention pourra egaiement 

comprendre : 
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a) une sequence ayant au. moins 80 % de similarity avec la 
sequence codant une dextrane-saccharase exprimee par le piasmide pCR- 
T7-cferE dans E. coli depose § la CNCM le 15 mars 2001 sous le numero I- 
2649 (E. CO// JM 109 [pCR-T7-dsrD]). ou 

b) une sequence compl6mentaire de la sequence en a). 

La denomination de la souche transformee par !e piasmide 
recombinant pCR-T7-c/sfE et deposee a la CNCM est celle indiquee ci- 
dessus entre parentheses. Cela n'affecte pas le changement de 
denomination du g^ne opere ulterieurement au d§p6t de ladite souche pour 
les raisons 6voqu6es supra. 

^invention porte ^alement sur les fragments d'acides 
nucteiques tels que d^finis ci-dessus. hybridables avec la 
sequence ID No. 4, et utilisables comme sondes d'hybridation pour la 
detection de sequences codant des enzymes selon invention. Ces 
fragments peuvent §tre prepares par toutes les techniques connues de 
rhomme du metier. 

Outre les sondes d'hybridation. des amorces d'amplification 
font ygalement partie de Tinvention. Lesdites amorces sont des fragments 
hybridables avec la SEQ ID No. 4 ou avec son brin compl^mentaire et 
permettent Tamplification de sequences specifiques codant des dextrane- 
saccharases presentes dans un organisme procaryote ou eucaryote, 
animal ou vegetal. 

L'utilisation de telles amorces d'amplification permet la mise 
en oeuvre d'un precede dMdentification de {'existence ^ventuelle d'un g§ne 
codant une enzyme apte ^ catalyser la synthese de GOS avec des 
ramifications a(1-»2) dans un tel organisme, ledit precede faisant 
egalement partie de Tinvention. 

L'invention porte egalement sur des vecteurs d'expression 
comprenant un acide nucleique tel que decrit ci-avant, sous le contrdle de 
sequence permettant son expression et de preference son excretion dans 
des cellules procaryotes ou eucaryotes. Par cellules procaryotes, on 
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choisira de preference des bacteries choisies dans un groupe comprenant 
E. CO//, las Lactococcus, les Bacillus, les Leuconostoc. Par cellules 
eucaryotes, on choisira de preference les eucaryotes cholsis dans un 
groupe contenant les levures. les champignons ou les vegetaux. 

Le vecteur comprend un promofeur adapte a I'expression'de 
Tacide nucieique isole selon Tinvention dans le systeme d'expression cholsi. 
A titre d'exem'ple, le promoteur du bacteriophage T7 pourrait §tre 
avantageusement choisi pour una expression dans E. colt. ' 

^invention porte egalement sur les cellufes hotes, procaryotes 
ou eucaryotes, transformees par un acide nucieique selon Tinvention de 
preference comprls dans un vecteur d'expression portant un pronnoteur, 
adapts a une expression dans*'les cellules hotes choisies. Les cellules 
transfomnees sont choisies dans le groupe des bacteries a Gram- telle E. 
co//, ou dans le groupe des bacteries a Gram+ telles Lactococcus, Bacillus, 
Leuconostoc ou parmi les eucaryotes dans un groupe comprenant les 
levures ou les champignons, ou les vegetaux. 

Un exemple particuiier d'une cellule transformde selon 
I'invention est la souche E. cofi hebergeant un plasmide appelS PGR- 
T7dsrE et porteur de la sequence ID No. 4 sous le contrdle du promoteur 
du bacteriophage T7 et deposSe d la CNCM le 16 mars 2001 sous le 
numero 1-2649. * 

La presente invention, par ailleurs, porte sur un precede de 
production d'une glycosyltransferase apte a former des dextranes ou des 
oiigosides presentant au moins 15 % et de preference au moins 20 % de 
ramifications de type a(1^2) osidiques et comprenant : 

a) rinsertion d'un acide nucieique ou d'un vecteur tei que 
decrit prScedemment dans une cellule hdte apte Texprimer et de 
preference S s§creter la glycosyltransferase ; 

b) la caracterisation de Tactivite enzymatique recherchee par 
toutes les methodes accessibles a I'homme du metier ; 

c) la purification de I'enzyme a partir d'un extrait cellulaire. 
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Par methode de caracterisation de I'activite enzymatique 
connue de rhomme du metrer, on comprendra les methodes decr'rtes dans 
ia litterature par exempte dans la refierence (2) ainsi que de nouveiles 
methodes susceptibles d*§tre mrses au* point permettant d'identifier et de 
5 discriminer les glucooligosaccharides pr^sentant le taux de ramification 
rechercli6. 

li s'agit en fait de tout precede de criblage pernnettant 
d'identifier la presence de ramifications a(1-»2) dans un GOS. 

A titre d'exemple, seront utilisees : 
10 - THPLC pour lequel la migration des GOS varie en fonction 

de (a nature et le positlonnement des ramifications, notamment ceux ayant 
le lien ai'\->2) § Textremite redudrice et ceux ayant ce lien sur I'avant- 
demier glucose, et/ou 

- ia Resonance magnetique nucieaire (RMN), 

15 - Texistence d'une reaction positive avec des anticorps 

monoclonaux specifiques des liaisons a(1-)^2) sur Textremlte reductrice 
et/ou d'anticorps monoclonaux specifiques des liaisons a(1-»2) sur Tavant- 
demier glucose du GOS. 

L'invention porte egalement sur un procede d'obtentlon d*une 

20 glycosyltransferase apte ^ presenter des oligosides ou des dextranes 
pr^sentant un taux de ramrfication a(1->2) superieur a 16 % et de 
pr^f^rence superieur d 30 % de la totalite des liaisons osidiques et 
comprenant une etape de modification de la sequence ID No. 4 par 
addition, deletion, mutation a partir du moment ou : 

25 - le cadre de lecture n'est pas modifie, et 

- les acides amines suivants sont conserves apres traduction : 

W en positions 425 ou 2122, code par ie triplet TGG en 
positions 1273 et 6364, 

E en positions 430, 565. 2127 et 2248. codes par les 
30 triplets GAA en positions 1288, 1693. 6379 et 6742 respectivement, 
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D en positions 487. 489, 527, 638, 2170 et 2210 codes par 
les triplets GAT en positions 1459. 1465. 1579. 1912, 6508 et 6628 
respectivement,' 

D en positions 2172 et 2322 codes par les triplets GAT en 
5 positions 6514 et 6964, 

H en position 637 et 2321 , codes respectivement par les 
triplets CAT en position 1909 et CAC en position 6961 , 

Q'en positions 1019 et 2694 codes respectivenient par les 
triplets CAA (position 3055) et CAG' (position 8086). ' * ' 
10 Un p'rocedS de production d'une gfycosyltransferase selon 

rinvention ayant les nn§mes caracteristiques que. ci-avant peut egalement 
comprendre : * :> ■• : 

- une etape de modification aleatoire de la sequence ID n* 4 
et d'etablissement d'une banque de variants, 

15 - une etape d'expresslon de ces sequences modifiees dans 

une cellule hote appropriee, un hote abritant un variant. 

- une etape de criblage des botes exprimant une enzyme apte 
^ fonner plus de 15 % et de preference plus de 30 % de liaison a(1 2) 
sur un substrat approprie, 

20 - une ^tape d'Isolement du ou des genes ameliores. 

Dans un autre mode de realisation de I'invention, ie precede 
consiste a modifier la sequence ID No. 3 par duplication de tout ou partie 
du domaine catalytique CD2. 

On pourra comprendre que les precedes cl-dessus visent non 

25 seulement ^ I'obtention d'une glycosyltransfSrase apte a former des 
oligosides pre.sentant un taux de ramification a(1 -> 2) constant et 
reproductible, superieur § 15 % des ramifications totales mais §galement a 
ameliorer Ie taux de ramification a(1 2) dans Tobjectif de modifier les 
proprietes des oligosides obtenus dans Ie sens d'une amelioration de leurs 

30 proprietes dietetiques ou de leur capacite a maintenir ou retablir la flore 
bacterienne associee a certains organes du corps humain ou animal. 
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La presents invention porte enfin sur les glycosyltransferases 
susceptibles d^etre obtenues par un precede crte ci-avant et apte a former 
au moins 15 % et de preference au moins 30 % de ramifications de type 
cc{i 2) osidiques dans des glucooligosaccharides. 

5 L'invention porte enfin sur I'utilisation des glycosyltransferases 

selon rinvention ainsi que ceiles susceptibles d'etre obtenues par les 
precedes ci-dessus. dans la fabrication d'une composition a effet 
prebiotique ou dans la fabrication d'une composition dermatologique, 
cosmetique ou phamnaceutique. 

jQ A titre d'exemples non limitatifs, on peut citer I'am^lioration du 

transit intestinal chez les animaux et chez Thomme. ram^lioration de 
Tassimilation du calcium et/ou du magnesium et des mineraux en general, 
la prevention du cancer du colon, la prevention ou le traitement des 
affections de la peau telles Tacne, les pellicuies, les odeurs corporelles. 

15 Uavantage des polypeptides et des acides nucleiques codant 

ces polypeptides selon j'invention se situe non seulement au niveau de 
ramelioration en temne de qualite. de rendement, de reproductibilite. et de 
prix de revient des glycosyltransferases aptes ^ former des 
oligosaccharides avec des ramifications de type a(1 2) osidiques mais 

20 egalement dans la perspective de produire de nouvelies enzymes dont la 
fonctionnalite est amelior§e. 

Les figures, examples et description detallles ci-apres 
permettent, sans la limiter, d'illustrer les caract^ristiques et les 
fonctlonnalites particulieres des polypeptides d activite enzymatique et des 

25 sequences codant ceux-cl. Elles pemnettent en particulier d'iiiustrer de 
fagon plus precise la specificite du domaine catalytlque present dans la 
partie cariaoxylique de Tenzyme selon rinvention et son Evolution potentielle 
pour robtention d'enzymes ameliorees. 
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t gGENDE PES FIGURES : 

Figure 1 : structure des glycosyltransferases natives et des 
prot§ines recoTnbinantes derivees :1a figufe 1a) repf6sente ia structure des 
glycosyltransferases et des dextrane-saccharases decrltes dans la 

5 litterature'O). PS: peptide signal ; ZV: region v^ariable,' CD : domaine 
catalytique. GBD : donnalne de liaison au giucane. La figure 1b) represente 
ia structure de la giycosyltransferase selon Tinvention. Les figures 1c) a 1i) 
representent differentes constrijctibiis ' bdmportanf "des deletions' en 
compar'aison de la p'roteine DSR-E native. A(P'sycdrfesp6nci au cbntrdle' 

10 constltue par la fomie ehtiere donee dans le systeilne pBAD-tOPO 
Thiofusion (Invitrogen). 

Figure 2 : schema recapitulatif de la m^thbde de clonage de'la 
sequence nucleotidique codant une giycosyltransferase selon invention a 
I'aide d'une bibliotheque genomique en utilisant une sonde PGR decrite 

1 5 dans le tableau I et une sonde HindWVEcoRV respectivement. 

Figure 3 : comparaison des sequences signal de differentes 
glycosyltransferases de L mesenteroldes. Les acides amines conserves 
sont en gras. DSR-B : L mesenteroides NRRL B-1299 (4) ; DSR-S : 
L mesenteroides NRRL B-512F (5) ; ASR: L mesenteroides t4RRL B-1355 

20 (6). 

Figure^4 : alignement des 1 1 sequences repetees de Tenzyme 
DSR-E et observee's dans la zone variable. 

Figure 5 : alignement des sequences conserv^es du domaine 

catalytique. 

25 - Bloc A : acides amines essehtiels de la partie N-tenminale du 

domaine catalytique ; 

- Bloc B : acides amines de la partie du domaine catalytique 
de liaison au saccharose ; ' ' 

- Blocs C. D, E : blocs contenant les trois resldus d'acides 
30 amines impliqu6s dans la triade catalytique (6) ; 



- Bloc F : sequence contenant la glutamine 937 de GTF-I 
etudiee par Monchois etaL (7). 

Les acides amines entierement conserves sont indiqu^s en 
gras. « * » ; substitutions conservatives ; « : » : substitutions semi- 
conservatives ; — : GAP. Les numirotations sont celles de la sequence ID 
No. 2. 

Figure 6 : caracterisation HPLC des produits synth6tis§s par 
I'enzyme recombinante DSR-E. 

6A : analyse en HPLC des glucooligpsaccharides obtenus 
avec les dextrane-saccharases de L. mesenteroides NRRL B-1299. 

6B : analyse HPLC des glucooligosaccharides obtenus par la 
DSR-E recombinante. Lidentification des differents pics suivants : 

1 : fructose, 

2 : maltose, 

3 : sucrose, 

4 : panose, 
5:R4. 

6 : OD4. 
7: R5. 
8 : OD5, 

A. B. C : pics non identifies. 

6C : DSR-E recombinante deletee du domaine catalytique de 
la partie carboxylique de I'enzyme (A DSR-E). 

Figure 7 : analyse HPLC des produits de la reaction 
d'accepteur sur maltose, synthetises par les differentes formes entieres et 
d§let6es de la proteine DSR-E, 

L. m. B-1299 : melange de dejctrane-saccharases produit par 
L mesenteroides NRRL B-1299. 

L'identification des differente pics se fait comme suit : 

F : fructose 

U : maltose 
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S : saccharose 
P : panose 

R4, R6 : GOS comportant des liaisons a(1^2) 
. OD4/OD6 : GOS depourvus de liaisons a(1->2). 
MATERIELS ET METHODES : 

1) Souches bacteriennes. olasmides et conditions de 

croissance : 

toutes les souches sont conservees a -SCC dans des tubes 
contenant 1 5% de glycerol (v/v). 

Leuconostoc mesenteroides B-1299 (NRRL, Peoria, USA) est 
cultivee a 27*'C, sous agitation (200 RPM) sur milieu standard (saccharose 
40 g.r\ phosphate potassium '20"g.r\" extrait de levure 20 g.l"\ MgSd4- 
7H2O 0.2 gS\ MnS04-H20 0.01g.r\ NaCI 0.01g.r\ CaCb 0.02 g.r\ 
FeS04-7H20 0.01 g.r^ ). le pH etant ajuste a 6,9, 

Escherichia coll DH5a et JM109 ont 6t§ cultivees sur milieu LB 
(Luria-Bertani). 

La selection des clones recombinants de pUC18 ou pGEM-T Easy 
est effectu^e sur boites LB-agar supptemente avec 100 pg.mP^ 
d'ampicllline, 0.5 mM dIsopropyl-p-D-thiogalactopyranoside (IPTG) et 40 
Mg.mP^ de 5-bromo-4-chloro-3-indolyl-p-D-galactopyranoside (X-gal). Des 
cellules d* E, co// TOP 10 ont ete utilisees pour le systeme de clonage de 
prodult PGR TOPO Cloning (Invitrogen). et cultivees sur milieu LB 
supplemente de kanamycine a la concentration de 50 jjg.mPV 

En ce qui concerne Texpressfon de ds/E. le kit de clonage ECHO 
Cloning System (Invitrogen) permet le clonage d'un produit PGR dans un 
vecteur donneur (pUNI/VS-His-TOPO), precedent une etape de 
recombinaison avec un vecteur accepteur adapt6 (pCR-T7-E). Ce systeme 
requiert des cellules E. colt PYR1, TOP 10 et BL21(DE3)pLysS cultivees 
sur milieu LB suppl§mente de 50 pg.mP^ de kanamycine. ainsi que de 
34 pg.ml"^ de chloramphenicol pour la souche BL21(DE3)pLysS. 
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Les plasmides pUC18 digeres et dephosphoryles proviennent 
de Pharmacia (Amersham Pharmacia Biotech) et ont 6te utilises pour la 
constitution de banque d'ADN genomique de L mesenferoides NRRL B- 
1299. Le clonage de produit PGR a, quant ^ lui, n^cessite Temploi de 
plasmide pGEM-T Easy (Promega), et pour les fragments de plus de 2 kbp. 
de plasmide TOPO-XL (Invitrogen). 

Le systeme pBAD-TOPO Thiofusion (Invitrogen), utilise pour 
construire les differentes formes deletees de la proteine DSR-E, met en jeu 
le promoteur araBAD, dont les mecanismes de contr6le impliquent la 
proteine regulatrice AraC. En Tabsence d'inducteur, a savoir le L-arabinose, 
la proteine dimerique AraC s'associe aux stoictures rSgulatrices de Toperon 
et entrame la formation d'une boucle cTADN. ladite boucle bloquant ainsi la 
transcription des genes places sous le controFe du promoteur araBAD. En 
presence de L-arabinose en revanche, AraC forme un complexe, ce qui 
libere la boucle d'ADN et permet {'initiation de la transcription. Uexpression 
basale peut etre limitee en ajoutant du glucose au milieu de culture : celur- 
ci intervient en diminuant le niveau d'AMP cycllque. et done Pactivation 
concomitante de la proteine CAP (cAMP activator protein). Le niveau 
d'activation obtenu est fonction de la concentration en L-arabinose, de telle 
sorte que les conditions optimales de production de la proteine d'interet 
peuvent etre selectionnees avec precision. 

De plus, I'emploi de ce vecteur permet de positionner une 
etiquette thioredoxine de 12 kOa du cote N-temiinal de la proteine d'interet 
Cette fusion vise § favoriser la traduction du gene codant ladite proteine 
d'interet La proteine etiquette pemnet en outre d'augmenter la solubility de 
la prot§ine §i laqueile elle se trouve fusionnee. Le systeme pBAD-TOPO 
Thiofusion est' congu pour pennettre d'dfiminer facilement I'etiquette 
thioredoxine, par simple clivage a Taide de Fenterokinase. Enfin, grace a ce 
systeme d*expression, une etiquette histidine est inseree du cote de 
I'extremite C-terminale de la proteine d'inter§t.* Une telle etiquette est utile 
pour purifier ladite proteine par affinite. 
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Dans le cadre de Tutilisation de ce systeme, la souche E. co// 
TOP 10 a ete- cultivee sur milieu' LB supplemehte de 100 pg.mr^ 
d'ampicilline. ; • ' - ^ ^ ■ 

2) Electrophorese sur ael. localisation et caracterisation de 

renzvme : 

Apres une culture de L mesentemides NRRL B-1299"de 7ii, 
le milieu a ete centrifuge (7000 RPM, 4^C, 30 min) et ies cellules, ou 90% 
de Tactivite enzymatique se retrouve, ont ete concentrees 10 fbis dans une 
sbiution de tampon acetate (20 rriM,'pH S;4y; cHaulfees 5' mlnutei a 95*'C:" 
en presence de 'solution de denaturation (Tris HCI 62.5 mM, SDS 4%. uree 
6M. bleu de brdhiophenpl 0.01% et p-mercaptoetRanoI 200 mM). 300 pi du 
melange a 6te depose sur gel de polyacrylamide a'7%. Apres migration, les 
proteines totales ont 6t§ revelees par coloration au noir amide, alors que 
Tactivite dextrane-saccharase a ete detectee par coloration du poiymere au 
reactif de Schiff apr^s synthese de dextrane in situ. Les bandes 
correspondant a des dextrane-saccharases actives ont ete excisees et 
incubees separement dans 2 ml de solution d'acetate de sodium 20 mM pH 
5.4 contenant lOOg.l"^ de saccharose et 50 g.l"^ de maltose. Apres 
consommation totaie du saccharose, la reaction a ete arretee par chaufFage 
k BS'^O pendant 5 minutes, et le milieu reactionnel centrifuge 5 minutes a 
15000g afin d'§liminer le dextrane insoluble. Les echantillons ont ete 
analyses par chromatographie en phase inverse' ( colonne C18, Ultrasep 
100, 6 ym. 5x300mm, Bishoff Chromatography) en utilisant de Teau 
ultrapure comme eluant, a un debit constant de 0.5 ml.min*''. Les 
oligosaccharides ont et§ separ^s pendant "30 minutes a temperature 
ambiante, et detect^s par refractometrie. Le s^qUengage peptidique a ete 
i-§alis§ sur les bandes prot^iques s^lectionnees par le Laboratoire de 
Microsequenfage. Instltut Pasteur, Paris. 

3) Techniques de bioloqie moleculaire utiiisees : 

La purification du plasmide de E. coii et la purification de 
I'ADN genomique de L. mesenteroides ont 6te realisees en utilisation 
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respectivement QiaPrep Spin Plasmid kit et le Cell Culture DNA maxi kit 
(QiaGen). Les precedes d'amplification et de clonage ont 6t§ r§aiis6s en 
utilisant les techniques standard (Sambrook et Russel, 2001, supra). Les 
enzymes de restriction et de modification, provenant des societes 
5 commerciales New England Biolabs ou Gibco BRL, ont ete utilis^es selon 
les protocoles des fabricants. 

La PCR a ete realisee avec des amorces choisies sur la base 
de la sequence proteique obtenue sur une bande de gel d'electrophorese 
isolee (voir supra, electrophorese sur gel et localisation de I'enzyme). Deux 
1 0 peptides ont ^te selectionn^s ; 

-29-FYFESGK,et " ' 

-24-FESQNNNP 

et utilises pour synthetiser des oligonucleotides d§gener§s et Indiques dans 

le tableau I ci-dessous. 
15 Dans ce tableau ou les numerotations sont celles de la 

sequence ID no. 4, ii apparatt que la presence d'un residu serine dans les 

deux peptides n^cessite la synthase de deux amorces pour chaque peptide 

dans la mesure oCi la serine peut etre codee par six codons differents. 

ECHO-dir et ECHO-inv sont les amorces utilisees ayant permis 
20 Tamplification de cfsrE par PCR pour son clonage dans le systeme 

d'expression ECHO Cloning (Invitrogen). 





TABLEAU I 




Designation 


Description 


Sequence 5'-3* 


29-dir1 
29-clir2 


FYFESGK 


TT(C/r)TA(CnOTT(C/T)GA(A/G)rC/\GG(C/G)AA(A/G) 
TT(Cn^TA(C/DTT{C^GA(A^G)i4GCGG(C/G)AA(A/G) 


24-inv1 
24-inv2 


FESQNNNP 


(T/G)GG(G/A)TT(G/A)TT(G/A)1 1 1 1 G / G/1CT/C)TCAAA 
(T/G)GG(G/A)TT(G/A)TT(G/A)TnTGGCr(T/C)TCAAA 


IPCR-rev 
IPCR<fir 


Sequence nt 
5769-5798 
sequence nt 
8311-8342 


CCCTTTACAAGCTGATnTGCTTATCTGCG 
GGGTCAAATCCTTACTATACATTGTCACACGG 


ECHO-dir 


sequence nt -6 - 
39 

Sequence nt 
8457-8504 


AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG 


ECHO-inv 


ATTTGAGGTAATGTTGATTTATCACCATCAAGCTTGAAATATTGACC 
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PGR : 

La PGR a ete r§alisee en utilisant un thermocydeur Perkin- 
Elmer» modele 2400, et avec SO'iidnbgrammes Cf'ADN g^rrdrffique/^Lfes* 
quantites d'amorces utilisees etaient de 10 pM de 2^-DFr1 et de 24-1 riv1. Au 
melange reactionnel, ont ^t^ ajoutes 250 pM de ctiaque desoxynUcieotide 
triphosphate, et la Taq Polymerase. ^ 

Apres une amplification- de 25 cycles a 94** C pendant 
SO secondes puis a SO'^G pendant' 30 secdndes, puis' d 72** C pendant 
5 minutes, un fragrtient deB66*paiires*'de Bas6 a etl§ pbt^nu: " ' ' ■ 

Certains fragments ont ete arnpiifi6s a Taide* du systeme 
« Expand Long Template PGR » (Roche Boehringer Mannheim), 
conformemenf aux indicatibns d'utilisatioh du fournisseur. Ce systeme 
permet d'amplifier des fragments de grande taille, jusqu'a environ 20 kbp, 
de maniere tres efficace. La combinaison de deux ADN polymerases 
permet notamment de minimiser le taux d'erreur durant les etapes 
d'elongation. 

Hybridation southern et bibliothdque qenomique de L, 
mesenteroides NRRL B-i299 : 

L'ADN chromosomique de L mesenteroides NRRL B-1299 a 
ete digere avec differentes enzymes de restriction, puis separ6 par 
electrophorese sur gel d'agarose a 0.8 %'en tampon TAB 0,5X. 

Des bibliotheques genomiques de la bacterie ont ete 
transferees sur des membranes de nylon hybond N+ (Amersham 
PharmaciaBlotech). Uhybridation a ete rea!is6e en utilisant le fragment de 
666 paires de bases a la desoxy-adenosine-triphosphate marque au ^P. La 
reaction de marquage a ete rSalisee en utilisant le kit de marquage ''Mega 
Prime DNA Labelling System Kit" (Amersham PharmaciaBiotech), suivie 
par la purification de la sonde sur des colonnes- MicroSpin S-200HR. La 
pre-hybridation et Thybridation ont ete realisees en conditions fortement 
stringentes (65** C pendant la nuit, selon les methodes habituelles) 
(Sambrook et Russel, 2001, supra). 
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PGR inverse : 

La reaction de PGR inverse permet d'obtenir un fragment 
d*ADN lin^aire ^ partir d'une matrice circulaire eri utilisant des amorces 
divergentes. 

UADN genomique de L mesenteroides NRRL B-1299 a §te 
dig^re par EcoRV dans les conditions recommandees par le fournisseur. 

Aprds re-circu!arisation, les produits de digestion ont ete 
utilises comme matrice dans une reaction de PGR inverse [Extrapol II DNA 
polymerase (Eurobio), volume reactionnel de 50 pi, parametres de la 
reaction de PGR inverse: 25 cycles; 94** G, 30 secondes ; 5r G, 
30 secondes ; 72* G, 3 minutes]. Les deux amorces ont et6 choisles en 
fonction de la sequence de Tinsert'de pSB2 comme indique dans la 
figure 2. 

La figure 2 resume les modalites d'obtention des differents 
plasmides porteurs des fragments de dsrE par criblage de la blbliottieque 
genomique et utilisation des sondes decrites ci-dessus. 

Sequence d'ADN et analyse : 

Apres le sequengage des peptides, des amorces degenerees 
dessin§es en tenant compte de la frequence d'utilisation des codons dans 
les genes de dextrane-saccharases de L mesenteroides NRRL B-1299. 
ont ete synthetisees et ont permis !*amplification d'un fragment de 666 bp. 
Le sequengage de ce fragment a revele de fortes homologies avec les 
genes de dextrane-saccharases deja connus, tout en etant totalement 
nouveau. 

Uutilisation de ce fragment comme sonde homologue dans 
des experiences de Southern, a permis de rep§rer des signaux positifs sur 
diff^rentes pistes d'ADN genomique digere. Une premiere banque H/ndlli a 
ainsi et§ cribl^e, et un plasmide recombinant, nomm§ pSB2, contenant un 
insert de 5,6 kbp. a ete purifie, Uanalyse de la sequence de ce fragment 
H/ndlll a revele un cadre ouvert de lecture couvrant la totalite de I'insert. 
Ensuite. une banque EcoRV a ete criblee avec une sonde H/ndlll/EcoRV 
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isoiee a rextremit6'N-terminale de I'insert H/ndlll de 5,6 kbp. Un plasmlde 
recombinant pSB3, teste posttivement par dot-blbt, s'est av6r6 contenir uh 
insert de 3,8 kbp qixT. apres seque'ngage, a ete nrorttri icbnt^rfir le coddn"' 
d'initiation de la traduction et ta region promotfice du nouveau gene de ' 
5 dextrane-saccharase nomme cfe/E. 

Dans 1^ but d'obtenir le codon de termina'isoh de dsrS, une 
PGR inverse a ete r^alisee sur de TADN genomique de L mesenteroides 
NRRL B-1299 digere par EcoRV et religue sur lui-meme, en utilisant des 
' amorces oligonuclebtidiiques divergent^es d"iessin§*es' 3' p>artir de \^ sSquence * 

10 de rinsert pSB2. Uri fragment unique ^ 'la tailie attendue de 1 kbp a et^ 
amplifie puis clon6 dans.un pGEM-T Easy, pour obtenir le plasmide pSB4. 
Apres sequen9age. la sequence amplifiee situ6e en aval du site H/ndlll 
comporte 221 bp et contient le codon de terminaison du cadre de lecture de 
dsrE, situe 30 bp en aval du site de restriction Hind\\\, 

15 Le sequen9age des differents fragments portes par les trois 

piasmides a ete realise par ta societe Genome Express et ce, sur les deux 
brins. Les analyses des sequences de nucleotides ont ^t^ realis§es en 
utilisant le "ORF Finder** (httD://www.ncbi.nlm.nih.Qov/gorf/qorf.htmn . Blast 
(httD:/ywww.ncbi.nlm.nih.gov/blast/blast.cqi . Altschul ef a/., 1997) ClustalW 

20 (http://www2.ebi.ac.uk/clustalw . Thompson et ai, 1994), PRODOM 
(http://protein.t6uldu'se.inra.fr/prodom.htmL Corpet et ai, 2000), PRAM 
(http://pfam.wustl.edu/hmmsearch.shtmL Bateman et a/., 2000) et SAPS 
(http://bioweb.pasteur.fr/seaanal/interfaces/saps.htmi . Brendel ef a/., 1992), 
Tensembie de ces logicieis ^tant accessible par internet. 

25 Expression de la proteine : 

Deux systemes de clonage et d'expression ont 6te utilises aux 
fins de la production de proteines recombinantes chez E. colt, a savoir les 
systemes ECHO-Cloning et pBAD-TOPO Thiofusion (Invltrogen). 

A titre d'exempie, se trouve brievement decrite ci-apres la 

30 methode de clonage de la sequence nucleotidique codant la proteine DSR- 
E au moyen du syst^me ECHO-Cloning. 
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Deux amorces telles que proposees dans !e tableau I ci- 
dessus oht ete utilisees dans le cadre de I'amplification d l*aide du systdme 
"Expand Long Template" dans les conditions suivantes : 94** C pendant 3 
minutes suivis de 25 cycles ^ 94** C pendant 30 secondes, 55"* C pendant 

5 30 secondes, et 68" C pendant 7 minutes. Les produits PGR ont ensuite 
ete clones dans le vecteur pUNIA/^5-His-TOPO, permettant Tobtention d'un 
vecteur donneur (pUNI-ofefE) a recombiner avec un vecteur accepteur 
(pCR-T7-E) et adapte a Texpression dans E. coli, Le plasmide final a ete 
designe pCR-T7-cfe/€. • 

10 Cefte construction, plagaht le gene dsrE sous le contrdle du 

promoteur du bacteriophage T7, a permls I'expression Inductible du gene 
dsrS, 

Apres induction avec 1 mM dMPTG, les cellules de E. coli 
BL21 transformees ont ete recoltees par centrifugation aprds 4 heures de 
15 croissance, et re-suspendues a une densite optlque finale de 80 a 600 nm 
dans du tampon acetate de sodium 20 mM pH 5,4 et du Triton X100 a 1% 
(v/v) en presence de 1 mM PMSF afin d*emp§cher la prot§olyse dans les 
extraits cellulaires apr§s sonlcation. 

Des experiences similaires, realfs^e avec le systeme pBAD- 
20 TOPO Thiofusion, ont permis de construire le vecteur recombinant pBAD- 
TOPO-ds^. 

Tests enzvmatiques : 

Les reactions enzymatiques ont ete realisees dans les 
conditions standard a 30 dans du tampon acetate de sodium 20 mM pH 

25 5.4. NaNs 1 g/T^ et saccharose 100 g/\'\ L'actlvite de Tenzyme DSR-E a ete 
determinee en mesurant la vitesse de liberation des sucres reducteurs, 
representes en I'espece par le fructose. ^ Taide de la methode ^ Tacide 
dinitro-salicylique bien connue de I'homme du metier. Une unite a ete 
definie comme la quantite d'enzyme qui catalysait la formation d'1 |jmol de 

30 fructose par minute dans les conditions standard. Les oligosaccharides ont 
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ete synthetises dans un milieu reactionnel contenant 100 g/1 de maltose, 
200 g/l de siaccharose et 0.6 unit§s/ml de DSR-E.' • 

Comme pour la synthesfe " de ddxtfa'n^V " la *r6acfion 
enzymatique a ete poursuivie pendant 24 heures 'eri presence de '100 g/l de 

5 giOcose. Le dextrane produit a ete jDrecipite en presence d'ethanol 50 % 
(v/v) et lave deux fdis dans rethahof a 50 %' (v/v) avant lybphilisatioh. Il a 
ensuite ete dissous a 10 mg/ml dans dD D2O et analyse par spectrometrie 

deRMrl du ^^C. " *\ 

Sebaration par HPLC : 

10 Des" ediantillons de 100 pi bnt 6t^ prfeleves fet chauff^s a 

95 **C pendant 5 min?utes. puis diluWs dans de Teau ultra-pure de maniere ^ 
obtehlr une concentJBtlon finale en "sucres totaux infSrieure a SgJ*". Apres 
centrifugation, les substrats residuels et les differentes especes formees 
ont ete analyses par HPLC sur colonne CI 8 (Ultrasep 100, 6 [itn, 

15 5x300 mm, Bishoff Chromatography). 

La separation des oligosides a ete realisee a temperature 
ambiante. pendant 30 minutes, dans de Teau ultra-pure appllquee k titre 
d*§luant ^ un d§bit de 0,5 ml/min. La detection a ete accomplie par 
refractom6trie. 

20 De telles conditions ont permis de separer les especes 

suivantes : fructose, hnaltose; leucrose, saccharose, ainsi que les oligosides 
dont le degre de polymerisation ne depassait pas 6. 
Calcul des rendements : 

La m^thdde de calcul des rendements des reactions de 
25 synthese d*o!igosides a pris en compte la concentration residuelle 
d'accepteur. conformement a la formule suivante : 

R = {[GOS finaux] - [GOS inltiaux]} / {0.474 x [saccharose consomme] + 
[accepteur consom me]} 

ou R represente le rendement reel de la reaction de synthese des GOS 
30 totaux. les concentrations etant exprimees en g/l. 
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Construction des differentes formes deletees de la 
proteine PSR-E : 

Les difterentes fomnes delet§es de ta proteine DSR-E [Figure ' 
1c) a ont ete obtenues par amplification par PGR des fragments 
5 correspondants du gene dsrE, puis clonage dans le vecteur pBAD-TOPO 

Thiofusion, dont la description est fournie supra. Les amorces utilisees pour • 
ramplification des regions selectiohn^es a partir du gene dsrE sont listees 
dans le tableau 11 suivant. Les positions des amorces sont indiquees en 
reference a ia sequence !D no, 5, relative § ia sequence du g^ne dsrE. Les 
10 bases mutees afin d'introduire le site de restriction Nco\ sont en caracteres 
gras et le site Afeol resultant est souligrie. 

TABLEAU II : 



Designation 


Positions 


S^uence 5-3' 


pBAD-PS/2V-djr 


344-373 


GCGATGGCAAATACGATrGCAGTTGACACG 


pBAD-ZV/CDI-dir 


971-1001 


GCCAIGGACGGIAAAACCIAI 1 1 ICTTGACG 


pBAD-CD1/G8D-dir 


3656-3682 


TCCATGGGTGAAAAAACAAGCACCGGC 


pBAD-GBD/CD2-dir 


6167-6189 


ACCATGGATATGTCTACTAATGC 


pBAD-CDI/GBD-inv 


3638-3658 


TAACTGTTTAGGCAAGAATCC 


pBAD-GBD/CD2-inv 


6146-6172 


TAATGTATTAGTGAATAAGTATTCACC 


pBAD-ent-inv 


8714-8737 


AATTTGAGGTAATGTTGATTTATC 



15 

Les amorces directes et inverses ci-dessus ont ete dessinees 
de mani^re a assurer (a fusion traductionnelle de Tetiquette thioredoxine en 
N-tenninal et Tetiquette polyhistidine en C-terminal des formes prot§rques 
tronqu§es en respectant les cadres ouverts de lecture des regions codant 
20 lesdites formes. 

Dans la mesure oil le plasmide pBAD-TOPO Thiofusion 
contient un site de restriction specifique de I'enzyme Nco\ situe au niveau 
de l'extremit§ 5* de (a region codant la tliioredoxine, un deuxieme site Nco\ 
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a ete introduit dans chaque amorce directe afin de pouvoir, !e cas echeant, 
extraire ladlte region. 

Les reactions d'ampffmcation* par PGR oht* ete realidees a 
Taide du systeme « Expand Long Template » dans* les ' conditions 
suivantes : une pre-denaturation a 94 **C pendant 3 minutes, suivie de 25 
cycles a 94 pendant 30 secondes, 52 ''C' pendant 30 s^cdndies et 6S °C 
pendant 7 minutes. 

Les produits d'amplification ainsi g§ner6*s oht ensuite 6te 
clones dans le vecteur pBAI>TOPO THibftislori aux fihs de la 
transfomnation subsequente de la souche E/'bo// tOP 10. Des clones* 
recombinants ont ete sfelectionnes, leur profil de restriction analyse afin 
d'identifier. pdur chacune des formes recherchdes, un plasmide 
recombinant portant rinsertion orientee comme attendu. 

Exempie 1 : Caracterisatfon et purification de i'enzyme 
DSR'E et obtention du gene dsrE 

Les enzymes produites par les cultures de L. mesenteroides 
et obtenues sur gel de poiyacrylamlde en SDS tel que decrit dans la partie 
Materiels et Methodes ont et6 Isoldes par d^coupe du gel. 

Les GOS produits par les enzymes ainsi Isoldes ont et§ 
analyses par HPLC selon les methodes decrites dans (1). L'enzyme dont 
i'activite etait recherchee a ete deduite de la nature des GOS produits. 
Apr^s proteoFyse trypsique et separation par HPLC des peptides produits, 2 
peptides : 29- R'FESGK et 24- FESQNNNP ont ete sequences et utilises 
comme modele pour la synthese d*amorces nucleotidlques degenerees. 

Leis drfferentes etapes d'ampllfication et de clonage sont 
representees dans la figure 2. Le gene complet a 6te insere dans !e 
plasmide pCR-T7-E et exprime dans E. &o//. 

La production d'une enzyme fonctionnelle est attestee par ia 
production des GOS dont Tanalyse HPLC est representee dans ia 
figure 6b). 
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On remarquera en particulier rimportance des pics 5 et 7 
repr6sentatifs des GOS ^ ramification a(1-^2). 

Exempfe2: caract4risation des sequences de dsrE et 

DSR'E 

5 2.1 Sequence nucleotidiaue : 

La sequence nucleotidique de Tenzyme est representee dans, 
la sequence ID No. 4. Ella est composes d'un cadre de lecture de 
8506 nucleotides. 

La sequence nucleotidique de Tinsert dans !e plasmide pCR- 
10 TJ'dsrE contient un site de liaison au ribosome (RBS), 9 bases en amont 
du codon d'initiation ATG et est composee d'un hexa-nucleotide GAGGAA/ 
2.2 Analyse de la sequence d'amino-acides : 
La sequence de 8506 nucleotides de dsrE code une proteine 
de 2835 acides amines representee dans la sequence ID No. 2. Le point 
15 isolectrique de cette proteine est de 4,88 et son poids moleculaire theorique 
de 313,2 kOa. En depit des fortes similarites avec ies dextrane- 
saccharases deja connues, DSR-E est caracterisee par una structure 
originale. 

L'alignement de la sequence d'amino-acides avec Tensemble 
20 des glycosyltransf§rases et des dextrane-saccharases connues conflnDe 
que la structure en domaine des glycosyltransf Erases et des dextrane- 
saccharases est conservee, a savoir: une sequence signal, une region 
variable, un domaine catalytique hautement conserve et un domaine de 
liaison au giucane. Cette structure est representee dans la figure la). 
25 Comme Tindique la figure 1b), un deuxieme domaine 

catalytique fonne la partie carboxy-terminaie de Tenzyme comme cela §te 
confimie par PRODOM et une analyse Blast. 

Avec un poids moleculaire de 313,2 kOa, DSR-E a environ 
2 fois le poids moleculaire moyen des autres glycosyltransf^rases et 
30 dextrane-saccharases (1), ce qui est en accord avec la presence d'un 
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deuxieme domaine catalytique a Textremite Oterminale et egaiement avec 
un dorhaine de liaison au glucane plus lonig. 

a^ analyse de la sequence signal : 

La sequence signal et la sequence nucleotidlque codant ie 
peptide signal sont extrSmement conservees si on les compare aux autres 
dextrane-saccharas^s comma ceci est indique dans* la figure 3. Le site de 
clivage est localise antra les acides amines 40 el 41. * ' 

b) domaine variable : ' ' ' 

En aval du peptide signal, DSR-E 'a lin' domaine variable de 
207 acides amines. Lorsqu'on Ie compare aux autVes domaihes variabi'es 
des glycosyltransferases. en utilisarit un programme d'alignement de type 
SAPS, on met en evidence la presence d'un motriF de 14 acides amines 
r6p§t§ 11 fois comme ceci est indique dans la figure 4. 

Ce motif repete, riche en alanine, threonine et acide 
aspartique n'a jamais et6 identifie precedemment. 

Le role et la signification de cette region n'ont jamais ete 
elucides. DiffSrentes etudes ont demontr^ que sa deletion n'affecte pas 
Tactivite enzymatique (4). Le r6le du motif r6pet§ de 14 acides amines qui 
n*existe pas dans les autres glycosyltransferases reste n§anmolns d 
determiner. 

c) analyse des domaines catalvtlgues : 

Le premier domaine catalytique s'etend" des acides amines 
248 a 1142 (CD1) de la sequence ID No. 2, alors que le deuxieme est 
localise entre les acides amihis 1980 et"2836 {CD2). Ces deux domaines 
pr^sentent 45 % d'identit^ et 65 % de similarity entre eux. 

GDI et CD2 contiennent les acides amines dejS identifies 
dans les glycosyltransferases et les dextrane-saccharases comme etant 
essentiels a leur activity enzymatique, et comme ceci est Indiqu^ dans la 
figure 5. 

Les triades catalytiques de GDI et GD2 determinees par 
analogie avec I'a amylase (7) sont presentes aux positions suivantes : 
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(Asp 527/Glu 565/Asp 638 pour CD1 et Asp 2210/Glu 2248/Asp 2322 pour 
CD2). 

D*autres rSsidus conserves bnt ete identifies comme 
importants pour Tactivite enzymatique : ies residus Trp 425/Glu 430 pour 
5 CD1 et Trp 21'22/Giu 2127 pour CD2, lesquels sont analogues a celles du 
domaine N-terminal de GI^I decrits par iVIonclnbis et ai (4) : Trp 344/G!u 
349. 

En revanche, certaines sequences situ^es dans la region 
conserv^e des glycosyltransferases et des dextrane-saccharases ne se 
10 retrouvent pas dans CD2 de DSR-£. Ainsi. comme indiqu6 dans la figure 5 
ci-dessous, Ies sequences FIHNDT! i22i4-2220) et KGVQEKV (2323- 
2329) divergent des aiitres sequences consensus des dextrane- 
saccharases deja ^tudiSes qui sont respectlvement NVDADLL et 
SEVQTVi. 

15 d) domaine de liaison au olucane : 

Lorsque Ton compare la sequence de DSR-E avec Ies 
sequences connues, il apparaTt que le domaine de liaison au glucane est 
sensiblement plus long. En effet, ce domaine a une longueur d'environ 
500 acides amines dans Ies glycosyltransferases et Ies dextrane- 

20 saccharases etudiees alors que dans DSR-E, il represente 836 acides 
amines. Plusieurs motifs repetes A et C et. en particuller, une serie de 
repetitions AC ont pu etre identifies. Dans le Tableau 111 suivant, sont 
indiquees Ies sequences consensus des motifs repetes du GBD, 
notam'ment des motifs A et C, d§crits dans la litt^rature relativement a des 

25 dextrane-saccharases de Leuconostoc et StrBptococcus spp. 
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TABLEAU III : 



Motif Sequence consensus 



A WWYFNxDGQAATGLQTIDGQTVFDDNGxQVKG ' 

B VNGKTYyFGSDGTAQTQANPKGQTFKDGSG\A:RFYNLEGQYVSGSGm 

C • DGKJYFFDPDSGEWKNRFV ■ ' ' 

D GGWKNADGTYSKY • * , . 

N YYFxAxQGxxxL " 



X : actde amine-indifferent 



5 Exeiriple 3 : expression de dsrE chez E. coti 

Des cellules de E. co// BI-21 (DE3) pLysS .pCR-T7-dsAE ont 
ete cultivees comme decrit ci-dessus. Apres gel d'electrophorese en 
polyacrylamide-(page-SDS) Tanalyse des extrarts proteiques a reveie 
effectivennent la presence de plusieurs bandes ayant Tactivite de dextrane 
10 saccharase, ladite activity 6tant mesuree comme cirdessus. 

La lignee E. co// JIV1109 [pCR-T7-cfs/0] a ete deposee a la 
GNCM le 15 mars 2001 sous le numero 1-2649. 

Identificati on et caracterlsation de ractivite enzvmatiaue : 
En utHisant une molecule accepteur de glucose, les dextrane- 
15 saccharases produites par E. colt recombinant ont ete comparees avec 
celles produites par L. mesenteroides NRRL B-1299.. 

L'analyse HPLC des produits de la reaction avec la DSR-E 
recombinante montre (figure 6) des- temps de-retention correspondant aux 
COS prealablement identifies R4 et R5 (2), Les oligosaccharides de'type R 
20 sont les series de GOS lineaires, le lien a(1^2) etant lie a Textremite non- 
reductrice. La serie OD. GOS lineaires resultant de-Ilens glycosidiques - 
a(1->6) avec un residu maltose a I'extremite reductrice, a ete observee en 
tres talbles quantites. Trois nouveaux composes sont en revanche detectes 
dans les produits de I'enzyme recombinante. 

25 
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ififintification des GOS procfuits : 

FinaJement, ia figure 6b montre clairement que les pics 5 et 7 
repr^sentant les GOS de la sirie R sont relativement plus importants avec 
I'enzyme recombinante qu'avec i'enzyme native dont les pics 
correspondant au panose et a OD5 sont plus importants. 

Exemple 4 : Effet de la deletion de CD2 sur I'activite 

enzymatique de DSR-E . .. . 

L'ADN gdnomique de L. mesentemides NRRL B-1299 a 6t6 
utilise comme matrice pour amplifier par PGR le g6ne cfsrE delete de la 
sequence correspondant au second domaine catalytique. Pour cela. 
2 oligonucleotides, ECHO-dir 

(5'-AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG) 
(SEQ. ID No. 6), con^spondant a la sequence nucleotldique -6 ^ 39 et 
contenant le codon d'initiation de la traduction, et ECHO-inv-del (5'- 
GTATTAGTGAATAAGTATTCACCATTGCATTTATCGTCAAAATAGTACG) 

(SEQ. ID No. 7) compl^mentaire de la sequence 5889-5937 et 
correspondant A la sequence peptidique YYFDDKGNGEYCFTNT, ont §te 
synthdtises, afin de fusionner rextremite C-temninale de ia proteine deletee 
avec un tag His present sur le vecteur de clonage. La reaction PGR a ete 
20 r^alisee grice a un DNA thennal cycler model 2400 (Perkin-EImer). avec le 
systeme Expand Long Template System (Boehringer Mannheim), suivant le 
cycle de temperature : g4°C pendant 3 min, puis 25 cycles avec : 30 s a 
94''G, 30s a SS'C et 7 min ^ ea'C. Le prbduit PGR a ensuite 6t6 clon6 dans 
le vecteur donneur pUNl. et le plasmide resultant, utilis6 dans une reaction 
25 de recomblnaison avec le vecteur d'expression pCR-T7-Acfe;E. 

La preparation des extraits cellulaires, les reactions 
enzymatiques, I'analyse des produtts de la reaction sont les memes que 
dans I'exemple 3 ci-dessus. 

Le profit HPLC des GOS obtenus avec I'enzyme DSR-E 
30 debtee du domaine CD2 apparaTt dans la figure 6 c). 
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Les GOS de type R, repr^sent^s par les pics 5 et 7 visibles 
dans ia figure 6 a) et 6 b)-sont totalement absents des produits obte'nus 
avec I'enzyme recombinante del^tee de 'CD2. ' Leg seuls produi^ 
anaiysables sont ceux correspondant a des oligosides Im^aires resultant de 
Hens a(1 6) avec un r^sidu maltose dans la partie reductrice. Ce resultaf 
indique ciairement le rdle essentiei'du domaine catalytique situe d^ns \a 
partie carboxy-terminale de Tenzyme dans sa capacite a former des 
Ifaisons osidiques a(1 2). . , 

Exemp!e 5 : etude des relations stniciure^fonction de la 
proteine DSR'E 

Le g^ne cterE, en ce qu'il est le prennier gene codant une 
dextrane-saccharase catalysant la syntlidse de liaisons a(1->S) a avoir ete 
clone, revet un int^ret partlculier. 11 est done important de caracteriser ce 
gene ainsi que son produit d'expression, en roccurrence en deterrninant 
quelle est rimplication des differents domaines composant la proteine OSR- 
E dans la fonction qui lui a 6te assignee, a savoir de correspondre a une 
dextrane-saccharase sp6cifique de la synttiese de liaisons a(1 ->2), ' 

5.1 Fomnes deletees de la proteine DSR-E : 

Uetude de six formes diff^rentes obtenues par deletion d'un 
ou de plusieurs domaines de la proteine DSR-E a ete envisag^e afin de 
determiner, en reference a la Figure 1 ci-dessous : (i) I'lnfluence de la 
presence du dqmaine CD2 en etudiant les constructions GBD-CD2 et 
A(CD2) ; (ii) Tinfluence de la presence de la zone variable en analysant les 
formes A(Z\/) et CD1-GBD ; et (iii) Je potentiel catalytique intrins^que des 
domaines CD1 et CD2 exprim^s de fagon isol§e (constajctions CD1 et 
CD2). 

L*activit6 catalytique de chacune des diff^rentes formes a ete 
comparee a celle observee avec le contrdle conrespondant a la forme 
entiere deletee du seul peptide signal A(PS) [Figure 1c)]. 
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5.2 Analyse des constaictions : 

A Tissue de la procedure expeiimentale d'ampHfication par 
PGR et de clonage- d6taillee supra, plusieurs clones presentant une 
insertion selon i'orientation escorriptee ont ete obtenus pour chacune des 

5 ■ constructions envisagees, a I^exception de la forme tronquee GBD-CD2 
pour laquelie !e produit d'amplification souhaite n'a pu etre clone. 

Les sequences des insertions ont et§ d^tenninees afin de 
s'assurer de I'absence de mutations susceptibles de modifier, apr^s 
traduction, des acides amines situes au niveau de positions presumees 

10 essentielles pour I'activit^' enaymatique de la proteine ainsi codee. 

Une mutation a et6 identrfiee au niveau de la 31^""^ base de 
rinsertion relative au contr6le A(PS), induisant la substitution d*un acide 
aspartique par une asparagine en position 10 de la zone variable. N'etant 
pas situ6e au niveau des motifs repetes S de la zone variable (Figure 4), il 

15 semblerait que Tincidence de cette mutation sur la fonction finalement 
observee soit negligeable. 

Une mutation a ete introduite dans !e produit d'amplification 
correspondant a la construction A(CD2). modifiant le rdsidu aromatlque 
F1411 en leucine. Cette mutation est situ6e dans le premier tiers du 

20 domalne de liaison au glucane GBD. au niveau d*une jonction entre deux 
motifs repetes. 

La construction A(ZV). eu egard aux erreurs effectuees par la 
polymerase lors de la reaction d^ampIification par PGR. ne presentajt pas la 
sequence attendue. En effet, I'insertion contenait un cadre ouvert de. 

25 lecture, ledit cadre con-espondant pour Tessentiel S la fomie GBD-CD2 qui 
n'avait pu §tre clon^e. Cependant, dans la fome GBD-CD2 obtenue en 
definitive k la place de A(ZV)» les 46 r^sidus N-temninaux etaient absents. 
Or. ie domaine GBD compte plus de 800 acides amines fomnant un 
enchamement de 24 unites repetees. Get enchaTnement est tei que, sur les 

30 46 residus tronques, seuis les 9 derniers etaient situes au niveau de Tune 
desdites unites, et en particulier au niveau de la premiere d'entre elles. 11 



paraissait en consequence plausible de considerer que la deletion de ces 
acides anilnes etait sans influence sur- la reaction enzynnatique catalys^e 
par la forme prot§ique correspondaht6-: C6ttfe"hypothes'e ^tslft d'alhant'fSlus * 
vraisemblable qu*il a 6t6 montre sor d'autres dextrane-sadfch^rafees, que la 
5 perte d'un certain nonnbre d'unit^s r^petees du domaine GB'D ne reduisalt 
• pas ractivite deia- proteine resultante dem&riiere significati>>e'i(8). 

' Uinsertion codant la forme CD'1-GBD contenait une mutation 
affectant ie residu F633, situe dans le domaine CD1, ei pius precis^merit/ 
au niveau d'une region fortenient coriservee- parnii les deixtfahe'- 
1 0 saccharases. 'e!le-m§rne I6calis6e jusfe aVahrt'le tfeuxieme acide aspartique^' 
de la triade ' catalytique (Figure 5). La phenylalanine attendue etait 
substrtuee par une leucine. H est difficile, a ce stade, d'estimer ilmpact 
d'une telle mutation sur I'activite catalytique observee. 

De la meme maniere que pour les autres constructions, la 
15 sequence des insertions codant les domaines catalytiques CD1 et CD2 
isoles est d§terminee. 

5.3 Produits d'expression et actives enzvmatiaues : 
Les prot6ines correspondant aux diverses formes deletees de 
DSR-E ont 6te exprimees en soumettant les cellules recombinantes de £ 
20 coli a une induction par le L-arabinose selon une concentration de 0,002 %. 

Uactivite enzymatique a ete observee pendant les quatre premieres heures 
qui suivaientVinduction. 

Les extraits proteiques obtenUs par sonication des cutots 
celiulairfes ont*6te analyses en ^fectroplidfese SDS-PAGE (Sambrdok et' 
25 Russel, 2001, supra). Les masses molecufaires des prot^lnes 
recombinantes ont §te estim§es k partir des profils eiectrophoretiques 
obtenus, lesdites masses correspondant pour I'essentiel aux masses 
attendues, en tenant compte de I'incrementation de 12 kDa iiee a I'etlquette 
thioredoxine. Le Tableau IV ci-apres resume les valeurs estimees des 
30 masses moleculaires des differentes formes tronquees et fournit, a titre de 
comparalson, les masses attendues. 
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TABLEAU IV : 



Forme proteique 


Masse attendue 
(kDa) 


Masse gttendue + ... 
thioredoxine (kDa) 


Masse estimee . 
(kDa) 


A(PS) . 


309 


321 . 


324 


A(CD2) 


218 


230 


ND 


GBD-CD2 


224 


/ 


233 


CD1-GBD 


193 


205 


199 


CD1 


99 


111 ' ' 


111 


CD2 


95 


'107* 


ND ■ 


ND : non determine. 



5 Dans le Tableau V suivant sont indiquees la nature et la 

position des acides amines marquant le debut et la fin des formes 
proteiques construites dans ie cadre de cette etude. Les dlfferentes 
posittons font reference a la sequence ID no. 2 correspondant a la proteins 
DSR-E. 

10 TABLEAU V: 



Forme proteique Acide amine de Acide amine de fin Longueur totale 
debut 



A(PS) 


N41 


12835 


2795 


A(CD2) 


Ml 


LI 980 


1980 


GBD-CD2 


Ml 188 


12835 


1648 


CD1-GBD 


1248 


L1980 * ' 


■ 1733 


GDI 


1248 


Q1141 


■ 894 


CD2 


D1981 


12835 


855 



La forme GBD-CD2 ne possedait pas I'etiquette thioredoxine. 
En effet, cette forme etait issue des aleas experimentaux occasionnes par 
1 5 la procedure d'amplification par PGR de la sequence censte coder la fomrie 
A(ZV). Eu egard aux deletions de sequences alors g6n§rees, I'etiquette 
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' thioredoxine, en principe situee en 5' de la proteine d'inter§t, n'avait pu §tre 
fusionn6e avec la. region GBD-CD2, * • ' * 

La "qualitS ' des gels 'd'electrophorese** h^a pas p^mils' de ^ 
determiner si le niveau d'expression des diff6'rentes fomries etaif 
5 quantitativement identique et, en consequence, si lesdites formes etaient 
pr^sentes dans Yes mem'es proportions dans les extraits cellulaires. ' * 

Aussi les mesures d'activite fournies ont ete etablies sur la 
base d'un volume donne d'extraits Cellufaires\ mais n'ont pu etre ramen^es 
• a la quantite de chaqlie proteine 'r^ellerrient cbntenue 'dans ledit volume ' 
10 d'extraits. 

La synthase de polym^res de dextrane in situ par incubation 
des gels d*§lectrophorese dans une solution de saccharose, et la coloration 
au reacttf de Schiff subsequente ont confirme la presence de proteines 
possedant une activite glucane-saccharase dans les extraits cellulaires 

15 correspondant a A{PS), A{CD2). GBD-CD2 et CD1-GBD. 

Dans le Tableau VI ci-dessous, sont presentees les activit^s 
enzymatiques maximales observees pour chaque construction. Les 
r6sultats ont confimn^ les donn^es tiroes des experiences de coloration des 
gels au r^actif de Schiff, savoir le fait que les extraits cellulaires relatifs 

20 aux formes A{PS), A(CD2). GBD-CD2 et CD1-GBD presentaient une 
activite saccharase, a I'inverse des deux domaines catalytiques pris 
isolement. Ce resultat etait conforrhe a la litterature, etant donne qu'il avait 
ete montre pour d'autres dextrane-saccharases, que Tabsence du domalne 
GBD induisait une perte d'activite enzymatique drastique (8, 9, 10). 



TABLEAU VI : 



Forme 
proteigue 


A(PS) 


A(CD2) 


GBD-CD2 


CD1-GBD 


GDI 


CD2 


Activite 
maximale 

m 


1063 


181 


86 


235 


5.3 


0 
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La forme CD1 possedait une activite Intrinseque de niveau 
suffisant pour etre detectee. Quant a la "forme GBD-CD2, elle presentait un 
niveau d*actlvite non n^gligeable, dent on pouvait conciure que 
Torganisatron structurale correspondante, ^ savoir un domaine catalytique 
5 en aval du domaine de liaison au glucane, demeurait enzymatiquement 
active. 

5.4 Effets des deletions sur la svntfiese d'oliqosides : 
Dans la mesure ou la sp§cificite de synthase des liaisons 
10 a(1->2) est conserv6e lors de la reaction en presence d'un accepteur, des 

experiences de synthase d'oligosides ^' partir de maltose ont d'abord ete 

effectuees (Figure 7). 

Lorsque les reactions ont 6t6 menses ^ leur temne, c'est-a- 

dire lorsque tout le saccharose a ete consomme, les rendements de 
15 synthese en oligosides ont ete calcules. Les resultats apparaissent dans le 

Tableau VII sulvant. Seule la reaction impiiquant Textrait cellulaire 

contenant la forme prot^ique CD1 n'a pu permettre un tel calcul. L'effet de 

la temperature a probablement conduit d Tinactivation de la tres faible 

activite presente dans Textrait protelque, 

20 

TABLEAU Vil : 



Forme proteique Rendement en Rendement en Rendement en 

oligosides de la serie oligosides de la serfe oligosides totaux 
' OP (%) R (%) 



Enzyme native 


36 


28 


64 


A(PS) 


41 


14 


55 


^CD2) 


67 


1 


68 


GBD-CD2 


45 


47 


92 


CD1-GBD 


100 


0 


100 
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Comme indique sur la Figure 7 d-dessous. la presence 
d'oligosides de la s§rie R n'etait deV:el§e qu*avec le^ formes enzymatiques 
posfe^dant le domkine catalytique" CD2. a Texc'epition '^du cas ou ledlt' 
dorriaine §tait isole et alors rendu completement inactrf. En effet. las temps 

5 de retention des oligosides synthetises par la fornie deletee du deuxieme 
domaine catalytique. ainsi que par la forme CD1-GBD, correspondalenf 
uniquement a ceux de la serie OD, o'est a dire aux GOS depouivus Be 
liaisons a(1->2). Ces r^sultats indiqualerit done que le domaihe CD2 etart 
requis pour la fomnation des liaisons a(i->2). 

10 Les produits obtenus avec ia forme GBD-CD2 bnt permis 

d'etayer ces observations. Cette construction, qui possedait CD2 comme 
seul domaine caialytique, etart capable de catalyser de maniere 
preponderante la synthese d'oligosides de la serie R, possedant des 
liaisons a(1^2). Ce resultat demontrait done que la specificite en terme de 

15 fonction de I'enzyme DSR-E reside dans la sequence tres originale de ce 
domaine, et non pas dans Tassociation de deux domaines catalytiques. En 
outre, la forme proteique GBD-CD2 pemnettait egalement la synthase de 
liaisons a(1->6). Toutefois. !es falbles rendements obtenus pour ces 
oligosides indiqualent .qu'iis etaient preferentiellement convertis en 

20 oligosides de degr6 de polymerisation superieur appartenant a la serie R, 
ce qui empdchait Jeur accumulation dans le milieu reactionnel. a la 
difference des molecules de la serie R qui, elles. n'etaient pas converties 
(2). 

En comparant les profils des produits obtenus, tels que 
25 montres a la Figure 7, il est apparu que la fomne entiere A{PS) synthetisait 
majoritairement des oligosides iineaires. En effet, ia molecule R4 etait 
absente et Poligoside R5 faiblement present. Le domaine catalytique CD1 
permettait. quant ^ lui, de catalyser la synthese exclusive de liaisons 
a{t-^6) et son activite semblait preponderante par rapport a celle du 
30 domaine CD2, Aussi. dans la forme entiere de I'enzyme. rimplication du 
domaine CD2 serait done moins importante du fait de : (i) parametres 
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catalytiques intrinseques plus faibles ; et/ou (ii) d*une configuration globale 
de I'enzyme d^favorable ^ son activite. 

En outre, i'enzyme enti^re A(PS) catalysait la synthese 
d'oligosides de la serie R avec un rendement inferieur S celui observe avec 
5 le melange de dextrane-saccharases produit par L mesenteroides NRRL 
B-1299 (Figure 7). Le rendement obtenu, de 28 %, etait situe entre ceux 
observes avec la forme entiere A(PS) d'une part, et la forme GBp-CD2 
d'autre part. Or, I'on salt que la souche sauvage produit plusieurs formes 
de dextrane-saccharases susceptjbles . d.e .synthetisej des liaisons 

10 osidiques, et notamment des liaisons a(1^2). Une liypothese avait ete 
§mise, selon laquelle lesdites formes etaient des produits de degradation 
de DSR-E. Ainsi, dans la mesure oD des formes tronqu^es de DSR-E, 
telles GBD-CD2, pouvaient catalyser la synthase d*oligosldes de la serie R 
plus efflcacement, ii semblerait que les rendements obfenus avec le 

15 melange heterogene produit par L mesenteroides NRRL B-1299 soient 
Imputables a la contribution des activites catalytiques de Tensemble de ces 
differentes formes enzymatiques. 

En conclusion, les inventeurs ont reussi, en isolant une dextrane 
saccharase particuliere produite par L mesenteroides, ^ caract^riser une 

20 structure particuliere et inattendue de cette enzyme apte S produire des 
oligosides d'int6r§t et prfeentant des ramifications de type a(1->2). 
L'identiflcation et la caracterisation de cette sequence permettent d'une part 
de construire des cellules ou organismes recombinants exprlmant de fa9on 
specifique cette enzyme et, d'autre part, d'en envisager.sa modification par 

25 mutagenese dirigee ou aleatoire ou par evolution moieculaire (DNA 
Shuffling) afin d'en amellorer encore ses caracteristques. 

Cette invention permet en outre d'am§liorer le rendement et la 
reproductibllit^ de la production des GOS d'int§r§t pour les differentes 
applications citees ci-avant. 
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REVENDICAtlONS 

1. Polypeptide isol§ ayarit una activite enzyniatlque de 
5 glycosyltransferase apte a former des' dextrSinfes presentant des 

* ramifications a(1 2) a partir de saccharose, d'a-D-fluoro-glucose, de 
para-nitrophenyl-a-D-glucopyranoside, ' d'a-D-glucopyrandside-aD- 
sorbofurano-side ou de 4-O-aD-galactopyranosylsucrose, caracterise en ce 
qu'il comprend au-!moins un domaine de liaison au glucane et un domalhe a 
10 activite catalytiquQ situ6 en aval du domaine de liaison au glucane. 

2. Polypeptide selon la revendication 1 comprenant au moins 
deux domaines catalytiques situes de part et d'autre du domaine de liaison 
au glucane. 

15 

3. Polypeptide selon la revendication 1 ou 2 comprenant un 
peptide signal, une region variable, deux domaines catalytiques et un 
domaine de liaison au glucane situ6 entre les deux domaines catalytiques. 

20 4. Polypeptide selon I'une des revendications 1 i 3 dans 

lequel le ou les dQmaine(s) a activite catalytique a (ont) un pourcentage de 
similarite compris entre 65 % et 100 % avec la SEQ. ID n**1 . 

5. Polypeptide selon Tune des revendications pr^cedentes 
25 dans lequel la tallle du domaine de liaison au glucane est superieure a 

500 aminoacides. ' 

6. Polypeptide selon la revendication 5 ayant la SEQ. ID n*'2. 
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1, Polypeptide selon la revendication 6 modifie' par 
substitution, insertion, deletion de sequences d'acides amines et 
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comportant des sequences pr6sentant au moins 80 % et de preference au 
moins 90 % de similarite avec les sequences suivantes de la sequence ID 
n** 2 : 

423 - 439 (SEQ. ID n" 6) . . 2120 - 2138 (SEQ. ID 12) 

478-501 (SEQ. ID n*^ 7) 2161 -2184 (SEQ. ID 13) 

519-539 (SEQ. ID 8) 2202 - 2214 (SEQ. ID n° 14) 

560 - 571 (SEQ. ID n° 9) ■ 2243 - 2?50 (SEQ. ID 1 5) 

631 -645 (SEQ. ID nMO) . 2315 - 2322 (SEQ. ID 16) 

1014-1021 (SEQ ID n** 11) 2689 - 2696 (SEQ. ID 17) 



8, Polypeptide selon la revendlcation 7 dans lequel les acides 
amines suivants sent inchang^s : 

W en positions 425 et 2122, 
E en positions 430, 565 et 2127, 2248, 
5 D en positions 487, 489, 527. 638, 2170, 2172, 2210 et 

2322, 

H en position 637 et 2321 , 
Q en position 1019 et 2694. 



10 9. Acrde nucleique fsole codant une enzyme ^ activity 

glycosyltransf^rase apte a former des dextranes presentant des 
ramifications a(1 2) a partir de saccharose, d'a-D-fluoro-glucose, de 
para-nitrophenyi-a-D-glucopyranoslde, d'a-D-glucopyranoside-aD- 
sorbofurano-side ou de 4-O-a-D-gaIactopyranosylsucrose, et 

15 comprenantau moins une sequence nucleotidique codant un domaine 
catalytique ayant au moins 50 %, et de preference au moins 80 % d'identite 
avec [a sequence ID n** 3, et srtue en 3' d'une sequence codant un domaine 
de liaison au glucane. 



20 
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10. Acide nucl§ique selon la revendication 9 comprenant : 

a) deux sequences codant des domaines'catalytiques ayant 
au moins '50%. et de preference au ifioins 80% d'id'entit§ avec' la 
sequence ID n* 3 ; ^. ' 

5 b) un^ sequence codant le domaine de liaison au glucane, ce 

dernier dtant situe <|e preference entre les deux sequences en a), 

11. Aclde nucleique isole iselon la revendication iO presentant 
* au moins 80 % d'identit6 avec 

10 a) la sequence ID n* 4 ou 

b) I'e b'rin complementaire de la sequence en a), ou 

c) une sequence hybridan! a) ou b) en conditions stringentes. 



12. Acide nucleique isole selon la revendication 11 constitue 
15 de la sequence ID n*" 4 ou son brin complementaire ou de la sequence 

deduite de la degen§rescence du code genetique. - 

13. Acide nucleique Isole selon la revendication 11 

comprenant : 

20 a) une sequence ayant au moins 80 % d'identite avec la 

sequence codant une dextrane saccharase exprimee par le plasmide pCR- 
TJ'dsrD depose a la CNCM le 15 niars 2001* sous le numero 1-2649, ou 
b) un^ sequence complementaire de ia sequence en a). 

* 

25 14. Vecteur d'expression comprenant un acide nucleique 

selon Tune quelconque des revendications 9 a 13. 

15. Vecteur selon la revendication 14 dans leque! Pacide 
nucleique est sousl le controle de sequence permettant son expression 
30 dans des cellules procaryotes ou eucaryotes. 
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16. Cellule hote transform^e par un acide nucleique selon 
Tune des revendications 9 a 13 ou un yecteur selon Tune des 
revendications 14^15. 

5 17, Cellule transform^e selon la revendicatron 16 choisie dans 

un groupe comprenant E. coll, les Leuconostoc, les v^getaux, les 
Lactococcus et les Bacillus ou les levures. 

18 cellule transfomi^e selon la revendication 17 caracterisee 
10 en ce qu1l s'agit d'une souche de E. coli depos^e ^ la CNCM le 
1 5 mars 2001 sous le n** 1-2649. 

19, Procede de production d'une dextrane saccharase apte a 
former des liaisons a1 ^ 2 comprenant : 
35 a) rinsertion d'un acide nucleique selon Tune des 

revendications 9 a 13 ou un vecteur selon Tune des revendications 14 a 15 
dans une cellule hote selon la revendication 16; 

b) la purification de Tenzyme a partir d'un extrait cellulaire. 

20 20. Procede selon la revendication 19 dans lequel la cellule 

hote est un procaryote choisi dans un groupe comprenant E. coli, les 
Lactococci, les Bacillus, les Leuconostoc, 

21. Procede selon la revendication 19 dans lequel la cellule 
25 hfite est un eucaryote choisi dans un groupe comprenant les levures, les 

champignons, les v^etaux. 

22. Procede d'obtention d'une dextrane saccharase apte a 
former des oligosides ou des dextranes presentant un taux de liaison 

30 a(1 -> 2) superieur a 30 % des liaisons totales comprenant une etape de 
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modification de la sequence ID n** 4 par additibh. delation*; mutation a partir 

du moment ou : 

-lecadrede lecture n'estp&snfiyrfifieVet -v - 

- les acides amines suivants sont conserves apres ti-aduction : 
•5 - • • ' W en positions 425 du' 2122', CDd6 par le triplet TGG eh 

• . positions 1273 at 6364; 

•E en positions -430; 565, 2127 "et 2248 codes par tes* 
triplets GAA en positions 1288. 1693, '6379 et 6742 
respectivement. 

10 - • • D en positions 487. 489. 527, 63'8, 2+70^^^^ 

les tripfets GAT en positions 1459. 1465. 1579. 1912, 

* 15508 et 6628 respectlvementi 

D en positions 2172 et 2322 cod6s par les triplets GAT en 
positions 6514 et 6964, 
15 H en position 637 et 2321, codes respectivement par les 

triplets CAT en position 1909 et GAG en position 6961. 
Q en positions 1019 et 2694 codes respectivement par les 
triplets GAA (3055) et GAG (8080). 

20 23. Proc6d§ d*obtention d'une glycosyltransferase isolee apte 

a former des olfgosides ou des dextranes presentant un taux de liaison 
a(1 -> 2) superieur a 30 % comprenant : ' ' 

- une etape de modification aleatoire de la 's^quence ID n'' 4 
et d'etablissement d'une banque de variants,' 

25 ' - une etape d'expres'sibn de ces sequences modifiees dans 

une cellule hote appropriee, un hote abritant un variant, 

- une etape de criblage des hdtes exprihnant une enzyme apte 

a former plus de 30 % de liaison a(1 -> 2) sur un substrat appropri^. 

- urie etape d*isolement du ou des genes ameliores. 
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24. Glycosyltransf6rase apte d former au moins 30 % de 
liaison a(1 -> 2) susceptible d'§tre pbtenue par un .precede selon Lune des 
revendications 19 ^ 22. 

5 25. Utilisation d'une glycosyltransf6rase obtenue par un 

procedS selon Pune des revendications 19 a 22 dans la fabrication d'une 
composition a effet prebiotique, 

26, Utilisation d'une glycosyltransferase obtenue par un 
10 proc6de selon Tune des revendications 19 d 23 dans la fabrication d'une 
composition pharmaceutique ou cosmetique. 
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lTste de sequences 
<liO> Centre National de la Recherche Scientifique 



<120> MOLECULE D^ACIDES NUCLEIQUES CODANT UNE 

DEXTRANE-SACCHARASE CATAiYSANT LA SYNTHASE DE DEXtRANE 
PORTANT DES .RAMIFICATIONS DE TYPE ALPHA-1,2 OSIDIQUES , 

<130> B4787A (INPI) CNRS/INSA TOULOUSE 

<140> xxxxxxx 
<141> 2001-12-19 

<150> 0103631 . -* 

<151> 200i-03-l6 



<160> 17 

<170> PatentIn Ver. 2.1 



<210> 1 
<211> 855 
<212> PRT 

<213> Acides amines (doraaine catalytique n® 2) 
<400> 1 

Asp Met Ser Thr Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His 
1 5 10 .15 

Asp Ser Ser Ser Phe Asp His Thr Val Asp Gly Phe Leu Thr Ala Asp 

20 25 30 

Thr Trp Tyr Arg Pro Lys Ser lie Leu Ala Asn Gly Thr Thr Trp Arg 
35 40 45 

Asp Ser Thr Asp Lys Asp Met. Arg Pro Leu He Thr Val Trp Trp Pro 
50 55- 60 

Asn Lys Asn Val Gin Val Asnr: Tyr Leu Asn Phe Met Lys - Ala Asn Gly 
65 70 i 75 80 

Leu Leu Thr Thr Ala Ala Gin? Tyr Thr Leu His Ser Asp Gin Tyr Asp 
85 ; 90 95 

Leu Asn Gin Ala Ala Gin Asp-. Val Gin Val Ala He Glu Arg Arg He 
100 ; 105 110 

Ala Ser Glu His Gly Thr Asp, Trp Leu Gin Lys Leu Leu. Phe Glu Ser 
115 • 120 125 

Gin Asn Asn Asn Pro Ser Phe. Val Lys Gin Gin Phe He Trp Asn Lys 

130 135^ 140 

Asp Ser Giu Tyr His Gly Gly Gly Asp Ala Trp Phe Gin Gly Gly Tyr 
145 150 155 160 



Lou L-*^ "^vr CCy 7\sr: As'"! Fro Leu Thr Pro Thr 7hr Asn Ser Asp Tyr 
V -,65 X70 175 

arg G:.n Pro Giy Asn Aia Phe Asp Phe Leu Leu Ala Asn Asp Val Asp 
leC 185 190 

Asn Ser A.sn Pro Vai Val Gin Ala Glu Asn Leu Asn .Trp .Leu Kis Tyr 
195 200 205 

Leu Met Asn Phe Giy Thr lie Thr Ala Gly Gin Asp Asp Ala Asn Phe 
no 215 220 

Aso Ser lie Arg lie Asp Ala Val Asp Phe lie His Asn Asp- Thr He 

225 230 235 . 240 

Gin Ary Thr Tyr Asp Tyr Leu Arg Asp Ala Tyr Gin Val Gin Gin Ser 
. 245 250 255 

Glu Aia Lys Ala Asn Gin His He Ser Leu Val Glu Ala Giy Leu Asp 

260 265 270 . 

Ala Giy Thr Ser Thr He His Asn Asp Ala Leu He Glu Ser Asn Leu 
275 280 * 285 

Arg Glu Ala Ala Thr Leu Ser Leu Thr Asn Glu Pro Gly Lys Asn Lys 
290 295 30O 

Pro Leu Thr Asn Meu 3»eu Gin Asp Val Asp Gly Gly Thr Leu Ho Thr 
305 310 315 320 

Asp His Thr Gin Asn Ser Thr Glu Asn Gin Ala Thr Pro Asn Tyr Ser 
325 330 335 

He He Kis Aia Kis Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala 

340 345 350 

He Thr Asp Ala Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin 
355 360 365 

Leu Lys Aia Gly Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn 

370 375 380 

Lyn Lys Tyr Asn Scr Tyr Asn lie Pro Ser He Tyr Ala Leu Met Leu 
385 390 395 400 

Thr Asn Lys Asp Thr Val Pro Arg Met Tyr Tyr Gly Asp Met Tyr Gin 
405 410 415 

Asp Asp Cly Gin Tyj. Met Ala Asn Lys Ser He Tyr Tyr Asp Ala Leu 
420 <2S 430 

Val Ser Leu Met Thr Aia Arg Lys Ser Tyr Val Ser Giy Gly Gin Thr 
435 440 445 

Kot Ser Val Asp Asn His Gly Leu Leu Lys Scr Val Arg Phe Gly Lys 

450 455 460 

A.sp Aia Met Thr Ala Afr>n Asp Leu Gly Thr Ser Ala Thr Arg Thr Glu 
165 170 475 480 
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Glv Leu Gly Val lie lie Gly Asn Asp Pro Lys Leu Gin Leu Asn Asp 
485 490 495 

Ser Asp Lys- Val Thr Leu Asp Met Gly Ala Al.a His Lys Asn Qln Lys, 
500 ' 505 510 

Tv^ htQ Ala Val lie Leu Thr Thr Arg Asp Gly Leu Aia Thr Phe Asn 
' ^ 515- 520 • 525 -.1 

Ser Asp Gin Ala Pro Thr Ala Trp Thr Asn Asp Gin Gly Thr Leu Thr 
530 :' 535 540 . . . 

Phe Se^ Asn Gin Glu lie Asn Gly Gin Asp Asn Thr Gin lie Arg Gly 
545 5^0 555 560 

Val Ala Asn Pro Gin Val Ser Gly Tyr Leu Ala Val trp Val Pro Val 
565 570 . • • 575 

Gly Ala Ser Asp Asn G^n Asp Ala Arg Thr Ala Ala Thr Thr Thr Glu 
580 , 585 590 

Asn His Asp Gly Lys Val Leu His Ser Asn Ala Aia Leu Asp Ser Asn 
595 ' 600 605 

Leu lie Tyr Glu Gly Phe Ser Asn Phe Gin Pro Lys Ala Thr Thr His 
610 615 620 

Asp Glu Leu Thr Asn Val Val lie Ala Lys Asn Ala Asp Val Phe Asn 
625 630 635 640 

Asn Tro Gly He Thr Ser Phe Glu Met Ala Pro Gin Tyr Arg Ser Ser 
645 650 .655 

Giy ASD His Thr Phe Leu Asp Ser Thr He Asp Asn Gly Tyr Ala Phe 
660 665 670 

Thr Asp Arg Tyr Asp Leu Gly Phe Asn Thr Pro Thr Lys Tyr Gly Thr 
675 680 685 

Asp Gly Asp Leu Arg Ala Thr He Gin Ala Leu His His Ala Asn Met 
690 695 700 

Gin Val Met Ala Asp Val Val Asp Asn Gin Val Tyr Asn Leu Pro Gly 
705 710 715 720 

Lys Glu Val Val Ser Ala' Thr Arg Ala Gly Val Tyr Gly Asn Asp Asp 
725 730 " 735 

Ala Thr Gly Phe Gly Tlir Gin Leu Tyr Val Thr Asn Ser Vaf Gly Gly 
740 745 750 

Gly Gin Tyr Gin Glu Lys Tyr Ala Gly Gin Tyr. Leu Glu Ala- Leu Lys 
755 760 7^5 

Ala Lys Tyr Pro Asp Leu Phe Glu Gly Lys Ala Tyr Asp Tyr Trp Tyr 

770 775 780 

Lys Asn Tyr Ala Asn Asp Gly Ser Asn Pro Tyr Tyr Thr Leu Ser His 
785 790 795 800 



Gly hsr Ara C'lv :";<vr lie Pro Ala hsv V&1 Ala He Lys Gin Trp Ser 
fr>=. SIC 815 

Ala Ivs Tyr Mel. Asn Giy 7hr Asn Vai Leu Gly Asn Gly Ke^ Gly Tyr 
<<20 825 830 

Vai Leu Lys Asp Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp 
833 840 * 845 



Lys Ser Thr Leu Pre Gin He 
850 855 



<210> 2 . . . 

<212> ?RT 

<213> Acides amines (proteine complete DSR-E) 
<400> 2 

Met Ara Asp Met Arg Vai He Cys Asp Arg Lys Lys Leu Tyr Lys Ser 
1. 5 10 15 

Gly Lys Vai Leu Vai Thr Ala Gly He Phe Ala Leu Met Met Phe Gly 
20 25 30 

Vai Thr Thr Ala Ser Vai Ser Ala Asn Thr He Ala Vai Asp Thr Asn 
35 40 45 

His Ser Arg Thr Ser Ala Gin He Asn Lys Ser Ala Vai Asp Lys Vai 
50 55 60 

Asn Asp Asr. Lys Thr Thr Leu Gly Ala Ala Lys Vai Vai Ala Vai Ala 
6S ^ 70 75 80 

Thr Thr Pro Ala Thr Pro Vai Ala Asp Lys Thr Vai Ser Ala Pro Ala 

85 90 95 

Ala Asp Lys Aia Vai Asp Thr Thr Ser Ser Thr Thr Pro Ala Thr Asp 
100 105 110 

Lys Ai'2 Vsi Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Vai 
115 120 ' 125 

Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Vai Asp Thr Thr 
130 135 140 

Pro Thr Thr Pro Ala Ala Asn Lys Ala Vai Asp Thr Thr Pro Ala Thr 
145 150 155 160 

Ala Aia Thr Asp Lys Aia Vai Ala Thr Pro Ala Thr Pro Ala Al.=i Asp 
165 170 . 175 



Lys Leu Ala Asn Thr Thr Pro Ala 
180 

Pro Alo Thr Fro Vai Aia Asn Lys 
135 200 



Thr Asp Lys Ala Vai Ala Thr Thr 
:S5 l<iO 

Ala Ala Asp Thr Ser Ser lie His 
205 



Asp Glr. Pro Leu Asp Thr Asn Vai Pro Thr Asp Lys Ser Ala Asn Leu 
210 215 220 



Vel Ser Thr Thr Gin Lys Ser Thr Asp Asn Gin Gin Val Lys Ser Thr 
225 230 235 

Glu Thr ser His Leu Gin Glu He Asn Gly- Lys Thr Tyr Phe Leu Asp 
245 250 ^^i* 

Asp Asn Gly Gin Val Lys llys Asn Phe Thr Ala lie He Asp,Gly Lys 
260 • 265 270 

Val Leu Tyr Phe Asp Lys 'ihir Ser Gly Glu Leu Thr Ala Asn Ala Pro 
275 \ 280 285 

Gin Vai Thr Lys Gly Leu Mai Asn He Asp Asn Ala His Asn Ala Ala ' 
290 2'95 300 

His Asp Leu Thr Ala Asp Asn Phe Thr Asn Val Asp Gly Tyr Leu Thr 

305 310 i 315 320 

Ala Asn Ser Trp Tyr Arg Piro Lys Asp He Leu Lys Asn Gly Thr Thr 
325 33a 335 

Trp Thr Pro Thr Thr Ala Glu Asp Phe Arg Pro Leu Leu Met Ser Trp 
340 : 345 • 350 

Trp Pro ASD Lys Asn Thr Gin Val Ala Tyr Leu Gin Tyr Met Gin Ser 
355 360 365 

' val Gly Met Leu Pro Asp Asp Val Lys Val Ser Asn Asp Asp Asn Met 
370 375 380 

ser Thr Leu Thr Asp Ala Ala Met Thr Val Gin Lys Asn He Glu Ser 
385 390 395 400 

Arq He Gly Val Ser Gly Lys Thr Asp Trp Leu Lys Gin Asp Met Asn 
405 410 415 

Lys Leu He Asp Ser Gin Ala Asn Trp Asn He Asp Ser Glu Ser Lys 
420 425 430 

Gly Asn- Asp His Leu Gin dly Gly Ala Leu Leu Tyr Val Asn Asp Asp 
435 440 445 

Lys Thr Pro Asn Ala Asn Ser Asp Tyr Arg Leu Leu Asn Arg Thr Pro 
450 ^^55 460 

Thr Asn Gin Thr Gly Gin He Thr Asp Pro Ser Lys Gin Gly Gly' Tyr 
465 470 ,: ^-75 . 480 

Glu Met Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro Val Val Gin 
485 , . 490 495 

Ala Glu Gin Leu Asn Trp Leu His Tyr Met Met Asn He Gly Thr He 
500 505 510 

Ala Gin Asn Asp Pro Thr Ala Asn Phe Asp Gly Tyr Arg Val Asp Ala 
515- 520 525 

Val Asp Asn Val Asp Ala Asp Leu Leu. Gin He Ala Gly Asp Tyr Phe 
530 535 540 
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Lys AI.S. A.'c- Tyr Cly Thr Gly iys Thr Glu Ala Asn Ala Asn Asn His 
54 r. 550 5S5 , 560 

Tie 55(2r Tie L«u Glu Asp Trp A5sp Asn Asn Asp Ser Ala Tyr lie Lys 
J:65 570 ' 575 

Ala His Gly Asn Asn Gin Leu Thr Met Asp Phe Pro Ala His Leu Ala 
580 . 585 ^ 590 

Lau Lys Tyz Ala Leu Asn Ket Pro Leu Ala Ala Gin Ser Gly Leu Glu 
555 600 ^' 605 

Pro Leu lie Asn Thr Ser Leu Val Lys Arg Gly lys Asp Ala Thr Glu 
610 615 .620 

Asn Glu Ala Gin Fro Asn Tyr Ala Phe lie Arg Ala Kis Asp Ser Glu 
625 630 635 640 

Val Gin Thr Val lie Ala Gin Tie He Lys Asp Lys Tie Asn Thr Lys 
645 650 655 

Ser Asp Gly Leu Thr Val Thr Pro Asp Glu He Lys Gin Ala Phe Thr 
660 665 670 

He Tyr Asr. Ala Asp Glu Leu Lys Ala Asp Lys felu Tyr Thr Ala Tyr 
675 680 685 

Asrt lis ?vo Ala Ser Tyr Ale Val Leu Leu Thr Asn Lys Asp Thr Val 
690 635 700 

Pro Arg Val Tyr Tyr Gly Asp Leu Phe Ser Asp Asp Gly Gin Tyr Met 
705 710 715 720 

Sci Gin Lys Ser Pro Tyr Tyr Asp Ala lie Thr Ser Leu Leu Lys Ser 
72b 730 735 

Arg lie Lys Tyr Val Ala Gly Gly Gin Ser Met Asn Met Thr Tyr Leu 
740 745 750 

His Glu Cys Phe Asp Pro Ala Lys Asn Glu Thr Lys Pro Gin Gly Val 
755 760 765 

Leu Thr Ser Val Arg Tyr Gly Lys Gly Ala Met Thr Ala Asp Asp Leu 
770 775 780 

Gly Asn Ser Asp Thr Arg Gin Gin Gly He Gly Leu Val He Asn Asn 
785 790 795 ; 800 

Lys Pro =*he Leu Asn Leu Asn Asp Asp Glu Gin He Vsl Leu A.sn Met 
805 810 815 

Giy Ala Ala Kis Lys Asn Gin Ala Tyr Arg Pro Leu Met Leu Thr Thr 
820 825 830 

Lys Ser Gly Leu Gin He Tyr Asp Lys Asp Ala Gly Ala Pro Val Viil 
835 840 845 

Tyr Thr Asn Asp Ala Gly Gin Leu He Phe Lys Ser Asp Mot Val Tyr 
850 855 860 



Gly Vai Ser Asn Pro Gin Val Ser Gly Tyr Phe Ala Ala Trp Val Pro 
870 875 880 

Val Gly Ala Ser Asp Ser Gin Asp Ala Arg Thr Gin Ser Ser Gin Ser 
885 890 895 

Glu Thr Lys Aso Gly Asp Val Tyr His Ser Asn Ala Ala Leu 'Asp Ser 
900 .905 • 919; 

'* 

Asn val He Tyr Glu Gly Phe Ser Asn Phe Gin Ala Met Pro Glu Lys 
915 920 925 

Asn Asp Asp Phe Thr Asn Val Lys He Ala Gin Asn Ala Lys'.Xeu Phe 
930 i 935 --S^O . 

Lys Asp Leu Gly He Thr Ser Phe isiu Leu Ala ' Pro 'Gin Tyr Arg Ser* 
945 950 955 . 9^0 

Ser Thr Asp Asn Ser Phe Leu Asp Ser Val He Gin Asn Gly. Tyr Ala 

■ i • ' ' * 

Phe Thr Asp Arg Tyr Asp Val Gly Tyr Asn Thr Pro Thr Lys Tyr Gly 
980 ' 985 * 990 

Thr Val Asp Gin Leu Leu Asp Ser Leu Arg Ala Leu His Ala Gin Gly 
995 1000 1005 

He Gin Ala He Asn Asp Trp Val Pro Asp Gin He Tyr Asn Leu Pro 
1010 1015 1020 

GW Glu Gin He Val Thr Ala Val Arg Thr Asn Gly Ser Gly Tyr 
1025 1030 1035 1040 

Asp Tyr Asp Ser Val He Asn Asn Thr Leu Tyr Asp Ser Arg Thr Val 
^ 1045 1050 1055 

Glv Glv Gly Glu Tyr Gin Glu Lys Phe Gly Gly Leu Phe Leu Asp Gin 
1060 1065 1070 

Leu Lys Lys Asp Tyr Pro Ser Leu Phe Glu Thr Lys Gin He Ser Thr 
1075 / 1080 1085 

Asn Gin Pfo Met Asn Pr'o Asp Val Lys He Lys Glu Trp Ser Ala Lys 
1090 :i095 1100 

Tyr Phe Asn Gly Ser Asli He Gin Gly Arg Gly Ala Trp Tyr Val Leu 
li05 1110 3.115 1120 

Lvs Asp Trp Ala Thr Asn Gin Tyr Phe Asn Val Ser Ser Asp Asn Gly 
1125 1130 1135 

. Phe Leu Pro Lvs Gin Leu Leu Gly Glu Lys Thr- Ser Thr Gly Phe He 
1140 1145 1150 

Thr Glu Asn Gly Lys Thr Ser Phe Tyr Ser Thr Ser Gly Tyr Gin Ala 
1155 1160 1165 

Lys Asp Thr Phe He Gin Asp Gly THr Asn Trp Tyr Tyr Phe Asp Asn 
1170 . 11*75 1180 



A1.=J Gly :yr Met _.eu Thr y Lys Gin Asn lie His Asp Lys Asn Tyr 
ill-"; 1190 ' 1195 ' 1200 

Tyr ?hc l.o\a Fxc Asn Gly Val Glu Leu Gin Asp Ala Tvr Leu ?he Asp 
1205 1210 ' 1215 

Gly Asn Gin Glu Phe Tyr Tyr Asn Lys Ala Gly Glu- Gin Val Met Asn 
1220 ' ' 1225 • 1230 

Gin Tyr Tyr Gin Asp Ser Gin Asn Gin Trp His Tyr Phe Phe Glu Asn 
1235 1240 1245 

ciy Arg Met Ala lie Gly Leu Thr Glu Val Pro Asn Ala Asp Gly Thr 
1250 1255 1260 

His Val Thr Gin Tyr Phe Asp Ala Asn Gly Val Gin He Lys Gly Thr 
1265 1270 1275 1280 

Ala lie Lys Aso Gin Asn Asn Gin Leu Arg Tyr Phe Asp Glu Ala Thr 
1285 1290 1295 

Gly Asn Met Val Val Asn Ser Trp Gly Gin Leu Ala Asp Lys Ser Trp 
1300 1305 1310 

Leu Tyr Lei: Asn Ala Gin Gly Val Ala Val Thr Gly Asn Gin Lys lie 

1315 1320 1325 

Asp Gly Glu Glu Tyr Tyr Fhe Asn Ala Asp Gly Lys Gin Val Lys Gly 
1330 1335 1340 

Asn Ala Tie He Asp Asn Asn Gly Asp Gin Arg Tyr Tyr Asp Gly Asp 
1345 1350 1355 1360 

Lys Gly Val Het Val Val Asn Ser Trp Gly Glu Leu Pro Asp Gly Ser 
1365 1370 1375 

Trp Leu Tyr Leu Asn Asp Lys Gly He Ala Val Thr Gly Arg Gin Val 
1380 1385 1390 

He Asn Asn Gin Val Asn Phe Phe Gly Asn Asp Gly Lys Gin He Lys 
1395 1400 1405 

Asp Ai5 Fh& Lys Heu Leu Ser Asp Gly Ser Trp Val Tyr Leu Aso Aso 
1410 1415 1420 

Lys Gly Leu Ho Thr Thr Gly Ala Lys Val He Asn Gly Leu Asn Met 
1425 1430 1435 1440 

Phr-f Phe Asp Lys Asp Gly His Gin He Lys Gly Asp Ala Ser Thr Asp 
1445 1450 1455 

Ala Asn Gly Lys P^rq His Tyr Tyr Asp Lys Asn Asp Gly His Leu Val 
1460 1465 1470 

Thr Asn Ser Trp Gly Glu Leu Pro Asp Gly Ser Trp Leu Tyr Leu Glu 
1475 1/180 1485 

Glu Gin Gly Asp Ala Val Thr Gly Gin Arg Val Ho Asp Gly Lys Thr 
1490 1/.95 1500 



Arq Tyr Phe Asp Glu Asp Gly Lys Gin lie Lys Asn Ser Leu Lys Thr 
1505 1510 1515 1520 

Leu Ala Asn Gly Asp Lys He Tyr Leu Asp Gly Asp Gly Val Ala Ala 
1525 1530 1535 

Thr Gly Leu Gin His Val Gly Asp Lys He Met Tyr Phe Asp, Glu Asp 
1540 .1545 . .1550 . 

Gly Lys Gin Val Val Gly Lys Phe Val Ser Ala Lys Asp Gly -Ser Trp 
1555 • 1560 1565 

Tvr Tyr Leu Asn Gin Asp Gly Val Ala Ala. Val Gly Pro Ser Se'r He 
1570 1575 . 1580 

Asn Gly Gin Ser Leu Tyr Phe Asp Gin Asp Gly Lys Gin Val Lys Tyr 
1585 1590 : 1595 . . 1600 

Asn Glu Val Arg Asn Ser Asp Gly Thr Thr Asn Tyr Tyr Thr (^^y Leu 
1605 ' 16ia- 1^15 

Thr Gly Glu Lys Leu Thr Gin Asp Phe Gly Glu Leu Pro Asp Gly Ser 
1620 . 1625 • 1630 

Trp He Tyr Leu Asp Ala Gin Gly His Thr Val Thr Gly Ala Gin He 
1635 1640 1645 

He Asn Gly Gin Asn Leu Tyr Phe Lys Ala Asp Gly Gin Gin Val Lys 
1650 1655 1660 

Gly His Ala Tyr Thr Asp Gin Leu Gly His Met Arg Phe Tyr Asp Pro 
1665 1670 1675 1680 

Asp Ser Gly Asp Met Leu Ser Asn Arg Phe Glu Gin He Thr Pro Gly 
^ 1685 1690 1695 

Val Trp Ala Tyr Phe Gly Ala Asp Gly Val Ala He Thr Gly Gin His 
1700 . .1705 1710 

Asp He Asn Gly Gin Lys -Leu Phe Phe Asp Glu Thr Gly Tyr Gin Val 
1715 1720 1725 

Lys Gly Ser Gin Arg Thr He Asp Gly Thr Leu Tyr Ser Phe Asp Ser 
1730 1735 1740 

Gin Thr Gly Asn Gin Lys Arg Val Gin Thr Thr Leu Leu Pro Gin Ala 
1745 1750 1-^55- 1760 

Gly His Tyr He Thr Lys Asn Gly Asn Asp Trp Gin Tyr Asp Thr Asn 
1765 « . 1770 1775 

Gly Glu Leu Ala Lys Gly Leu Arg Gin Asp Ser Asn Giy Lys Leu Arg 
1780 1785 1790 

Tyr Phe Asp Leu Thr Thr Gly He Gin Ala LyS Gly Gin Phe Val Thr 
1795 • 1800 , ' 1805 

He Gly Gin Glu Thr Tyr Tyr Phe Ser Lys Asp His Gly Asp Ala Gin 
1810 1815 1820 



i-tv- Lc5u Pro L-5et 7rir. -"iu Gly His Tyr Gly Thr lie Thx Leu Lys 

l"r2^ 1835 1S40 

Gin Gly Gin Asp Tnr Lys Thr Ala Trp Vai Tyr Arg Asp Gin Asn Asn 
1?'AZ 1850 1855 

Thr lie Leu Lys Gly Leu G:,n Asn He Asn Gly Thr Leu Gin Phe Phe 

1860 1865 1870 : 

t 

Asp Pro Vyr Thr Gly Glu Gin Leu Lys Gly Gly Val Ala Lys Tyr Asp 
1875 1880 1885 

Asp Lys Leu Phe Tyr Phe Glu Ser Gly Lys Gly Asn Leu Val Ser Thr 
1850 1895 1900 

Vr.i Ala Gly Asp Tyr Gin Asp Gly His Tyr He Ser Gin Asp Gly Gin 
19C5 1910 1915 1920 

Thr Arg Tyr Ala Asp Lys Gin Asn Gin Leu Val Lys Gly Leu Val Thr 
1925 1930 . ,1935 

Val Asn Gly Ala Leu Gin Tyr Phe Asp Asn Ala Tbr Gly Asn Gin He 
3940 1945 1950 

Lys Asn Gin Gin Val He Val Asp Gly Lys Thr Tyr Tyr Phe Asd Asp 
1955 1960 1965 

Lys Gly Asn Gly Glu Tyr Leu Phe Thr Asn Thr Leu Asp Met Scr Thr 
1970 1975 1980 

Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His Asp Ser Ser Ser 
1985 1990 1995 2000 

Phe Asp Kis Thr Val Asp Gly Phe Leu Thr Ala Asp Thr Trp Tyr Arg 
2005 2010 2015 

Pro Lys Ser He Leu Ala Asn Gly Thr Thr Trp Arg Asp Ser Thr Asp 
2020 2025 2030 

Lys Asp Met Arg Pro Leu He Thr Val Trp Trp Pro Asn Lys Asn Val 
2035 2040 . 20<55 

Gin Vol Asn Tyr Leu Asn Phe Met Lys Ala Asn Cly Leu Leu Thr Thr 
2050 2055 2060 

Ala Ala Gin Tyr Thr Leu His Ser Asp Gin Tyr Asp Leu Asn Gin Ala 
2065 2070 2075 . 2080 

Ala Gin Asp Val Cli: Val AJ a He Glu Arg Arg He Ala Ser Glu His 
2085 2090 2095 

Gly Thr Asp Trp Leu Gin Lys Leu Leu Phe Glu Ser Gin Asn Asn Asn 
2100 2105 2110 

Pro Sor Phe Val Lys Gin Gin Phe He Trp Asn Lys Asp Ser Glu Tyr 
2115 2120 2125 

His Gly Gly Gly Asp Ale Trp Phe Gin Gly Gly Tyr Leu Lys Tyr Gly 
2130 2135 21^0 



10 



Asn Asn Pro Leu Thr Pro Thr Thr Asn Ser Asp Tyr Arg Gin Pro Gly 
2145 2150 2155 2160 

Asn Ala Phe Asp'Phe Leu 'Leu Ala Asn Asp Val" Asp Asn Ser Asn Pro 
2165 2170 2175 

Val Val Glh Ala Glu Asn '=Leu Asn Trp Leu His Tyr Leu Me^ Asn Phe 
2180 2185 2190 . 

' ■* - 

Giy Thr He Thr Ala Gly Gin Asp Asp Ala Ash Phe hsp Ser ^le Arg 
2195 * \ 2200 * 2205 

He Asp Ala Val Asp Phe lie His Asn Asp "Thr lie- Glh Arg Thr Tyr 
2210 2:215 2220 , ■= .- ■ 

ASD Tyr Leu Arg Asp Ala -Tyr Gin Val Gin Gln' -Ser Glu Ala Lysf Ala " 
2225 2230 • 2235 2240 

Asn Gin His He Ser Leu Val Glu Ala Gly Leu Asp Ala Gly Thr Ser 
2245 .: 2250 2255 

Thr He His Asn Asp Ala Leu He Glu. Ser Asn Leu Arg Glu Ala Ala 
2260 ; 2265 2270 

Thr Leu Ser Leu Thr Asn 'gIu Pro Gly Lys Asn Lys Pro Leu Thr Asn 
2275 2280 2285 

Met Leu Gin Asp Val Asp Gly Gly Thr Leu He Thr Asp His Thr Gin 
2290 2295 2300 

Asn Ser Thr Glu Asn Gin Ala Thr Pro Asn Tyr Ser He He His Ala 
2305 2310 2315 2320 

His Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala He Thr Asp Ala 
2325 2330 2335 

Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin Leu Lys Ala Gly 
2340 2345 2350 

Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn Lys Lys Tyr Asn 
. 2355 . i 2360 2365 

Ser Tyr Asn He Pro Ser He Tyr Ala Leu Met Leu Thr Asn Lys Asp 
2370 2375 2380 

Thr Val Pro Arg Met Tyr':Tyr Gly Asp Met Tyr Gin Asp Asp Gly Gin 
2385 2390'. 2395 • 2400 

Tyr Met Ala Asn Lys Ser He Tyr Tyr Asp Ala Leu -Val- Ser 'Leu Met: 
2405 2410 2415 

Thr Ala Arg Lys Ser Tyr -Val Ser Gly Gly Gin- Thr Met Ser Val Asp 
2420 2425 2430 

Asn His Gly Leu Leu Lys .Ser Val Arg Phe Gly Lys Asp Ala Met Thr 
2435 2440 ' 2445 

Ala Asn Asp Leu Gly Thr /Ser Ala Thr Arg Thr Glu Gly Leu qiy Val 
2450 2455 2460 



n 




I'^f: lie C-ly Ar-n Asp ?rc Lyjs Leu Gin J,eu Asn Asp Ser Asp Lys Val 

2465 " 2 n0 2475 2480 

Thr Lea Asp Met C?Jy Ala Aid His Lys Asn Gin Lys Tyr Arg Ala Val 

2485 2450 2495 

lie Leu Thr Thr Arg Asp Gly Leu Ala Thr Phe Asn Scr Asp Gin Ala 

2500 2505 2510 

Tro Thr Asn Asp Gin Gly Thr Leu THr Phe Ser Asn Gin 

• 2520 * " 2525 

Gly Gin Asp Asn Thr Gin lie Arg Gly Val Ala Asn Pro 
2535 2540 

Gly Tyr Leu Ala Val Trp Val Pro Val Gly Ala Ser Asp 

2550 2555 - 2560 

Ala Arci Thr Ala Ala Thr Thr Thr Glu Asn His Asp Gly 

2565 . . 2570 -2575 



Pro Thr Ala 
2515 

Glu lie Asn 
2530 

Gin Vai Ser 
2545 

Asn Gin Asp 



Lys Val Lou His Ser Asn Ala .Ala Leu Asp Ser Asn Leu lie Tyr Glu 
2580 2585 2590 

Gly Phe Ser Asn Phe Gin Pro Lys Ala Thr Thr His Asp Glu Leu Thr 
2595 2600 2605 

Asn Val Val lie Ala Lys A.sn Ala Asp Val Phe Asn Asn Trp Gly lie 
26;0 2615 2620 

Thr Ser Phe Glu Met Ala Pro Gin Tyr Arg Ser Ser Gly Asp His Thr 
2625 2650 2635 2640 

Phe L©j Asp Ser 7hr Tie Asp Asn Gly Tyr Ala Phe Thr Asp Arg Tyr 
2645 2650 2655 

Asp Leu Gly Phe Asn Thr Fro Thr Lys Tyr Gly Thr Asp Gly Asp Leu 
2660 2665 2670 

Arg Alo Thr lie Gin Ala Leu His His Ala Asn Met Gin Val Met Ala 
2675 268C 2685 

Asp VoX Vai Asp Asii Gin Val Tyr Asn Leu Pro Gly Lys Glu Val Val 
2630 2695 2700 

Ser AjLa Thr Arg Ala Gly Val Tyr Gly Asn Asp Asp Ala Thr Gly Phe 
2705 2710 2715 2720 

Gly Thr Gin T.eu Tyr Val Thr Asn Ser Val Gly Gly Gly Gin Tyr Gin 
2725 2730 2735 

Glu Lys Tyr Ala Gly Gin Tyz Leu Glu Ala Leu Lys Ala Lys Tyr Pro 
2740 2745 2750 

Asp Leu The Glu Gly Lys Ala Tyr Asp Tyr Trp Tyr Lys Asn Tyr Ala 
2755 2760 2765 

Asn Asp Gly Ser Asn Pro Tyr Tyr Thr Leu Ser His Glv Asp Arg Glu 
2770 2775 2780 
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Se- lie Pro Ala Aso Val Ala He Lys Gin Trp Ser Ala Lys Tyr Met 
2785 2790 2795 2800 



l^sn Gly Thr Asn Val Leu Gly Asn Gly Met Gly Tyr VaX Leu Lys Asp 
2805 2810 2815 



Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp Lys Ser Thr Leu 
2820 2825 2830 ^ 



Pro Gin He 
2835 



<210> 3 
<211> 2568 
<212> ADN 

<213> Nucleotides (domaine catalytique n** 2) 



<400> 3 

gatatgtcta ctaatgcttt ttctaccaaa aatgttgcat tcaatcatga cagtagcagt 60 
ttcgaccata ctgttgatgg cttcttgacg gcagatactt ggtatcgacc aaagtcaatt 120 
ttggctaacg ggacaacttg gcgtgattcg actgataagg atatgcgacc attaatcact 180 
gtttggrggc caaataagaa tgttcaagtc aactacctca acttcaHgaa agcaaatggc 240 
ttgttgacaa cagcagcaca atacacacta cattcagatc aatatgattt gaaccaagct 300 
gcacaaaatg ttcaagtggc cattgaaagg cgcattgcgt cagagcatgg cacagactgg 360 
ttacagaaat tgttgtttga atcacaaaat aataacccat catttgtgaa gcaacaattc 420 
atttggaaca aggattctga atatcatggt ggtggtgatg cttggttcca aggtggttat 480 
ctgaagtatg gcaataaccc actcacacca acaactaatt ctgattatcg tcaacctggt 54 0 
aatgcatttg atttcttgct agccaacgac gtggataatt ctaatcctgt tgtgcaagct 600 
gaaaacttaa actggttaca ttacttaatg aactttggca ccatcactgc gggtcaagat 660 
gacgctaatt ttgatagtat tcgtattgac gctgtcgact ttattcataa tgatacaatc 720 
caacgtactt atgattatct tcgtgatgct tatcaagtgc aacaaagtga agccaaagca 780 
aaccagcaca tttcattggt tgaagctggc ttagacgcag gtacatcaac gattcataat 840 
gatgcgttaa ttgagtcaaa cctccgtgaa gcagcgacat tgtcgttaac aaatgaacct 900 
ggtaaaaata aaccattgac gaatatgcta caagacgttg acggcggtac gcttatcacc 960 
gaccatacgc agaatagtac agaaaatcag gcgacaccaa actattcaat tattcacgcg 1020 
cacgataaag gtgtgcaaga aaaagtaggt gcagccatta ctgatgctac tggtgctgat 1080 
tggacgaact ttacagatga acagttaaaa gccggattag agctattcta taaggatcag 1140 
cgcgcaacaa acaaaaagta taatagttat aacataccaa gtatttatgc cctgatgttg 1200 
acaaacaaag atactgttcc tcgtatgtat tatggggata tgtatcaaga tgacggacag 1260 
tatatggcaa acaagagtat ctactatgat gccttagtgt cattaatgac ggctcgtaaa 1320 
agctatgtca gcggtggtca aactatgagt gttgacaatc atggtttgtt gaagagtgtc 1380 
cgttttggaa aagatgcgat gacagctaat gatttaggta catcagctac gcgtactgag 14 40 
ggtcttggtg tcattattgg taatgatcca aagttgcaac ttaatgattc ggataaagtg ISOO 
acactggata tgggtgcagc acataaaaat caaaagtatc gcgcagttat cttaacaaca 1560 , 
cgtgatggtt tggcaacctt taattcagat caagcaccaa cagcttggac aaacgatcaa 1620 
ggaacgttaa cattctcaaa t^caagagatt aacgggcaag. aeaatacaca aattcgtggt 1680 
gttgctaatc cgcaagtttc tggttatcta gctgtttggg tgcctgtggg tgcatcagac 1740 
aatcaagatg cccgtacagc agcaacgaca acagaaaatc atgatggtaa agtattacac 18 00 ; 
tcgaatgcgg cattagattc taaccttatt tatgaaggtt tctctaactt ccaacctaag 18 60 
gcaacaacgc atgatgaact tacgaacgtt gtaattgcta aaaatgccga tgtcttcaat 1920 * • 

aattggggta ttacgagttt tgaaatggca ccacagtacc gttcaagtgg ggaccataca 1980 
t-tcttggatt caacgattga taatggttat gccttcactg atcgctatga cttaggtttc 2040' 
aatacaccaa caaagtatgg cactgatggt gatttgcgtg caacgattca agcgctacat 2100 
catgctaata tgcaagttat ggctgacgtt gttgataacc aggtctataa cttacctggt 2160 
aaagaagttg tttcagcaac acgagcaggt gtttatggta atgacgacgc cacgggcttt 2220 
ggaacgcaac tctatgtgac taactccgtt ggtggtggtc' aataccaaga gaaatatgct 2280 • 
ggacaatact tagaagctct gaaagcaaag tatccagacc tctttgaggg taaggcctat 2340 
gattattggt ataagaacta tgcaaatgat gggtcaaatc cttactatac attgtcacac 2400 
ggtgaccgtg aatctatccc agcagatgtt gctattaagc aatggtcagc taagtatatg 2460 



13 . 




aacgacscq.^ a.-qt rttqgg cnatftgtatg gcttatgtat tgaaggattg gcataatggt 2520 
c«at«-trcc ^jgcrtrgatyg tgataaatca acair.tacctc aaarttaa 256S 



<210> $ 
<21X> 8506 
<212> ADN 

<213> Sequence codant DSR-E 
^^OO 4 

atgagagaca tgagggtaat ttgtgaccgt aaaaaattgt acaaatcggg caaagtacta 60 
ctaacagccg gtatttttgc tctgatgatg tttggcgtca caactgctag tgttagtgca 120 
a.atacgautg cagttgacac gaatcatagc cgtacttcag cacagattaa taagagtgcc 180 
gttgataagg tcaatgatga caagactact ttaggagcgg caaaagtagt ggcagtagcc 240 
ara^5cncc?g cgsc&ccggt agcagataaa acagtaagtg cacccgcagc agaLaaggca 300 
gtsgatacaa cgtcatcaac gacacctgca acggataagg cagtagatac- aacgccaacg 360 
scacctgcag cagataaggc agtagataca acgccaacga cacctgcagc agataaggca 420 
g.tagatacaa cgccaacgac acctgcagca aataaagcag tagatacaac gccagcgacc 480 
gcfcgcaacag ataaggcggt agccacgcca gccacacctg cagcagataa gctagcaaat 540 
acgacgcctg caacggacaa ggcagtagcc acaacgccag cgacgccggt agcaaataaa 600 
gcagcagaca cgagtagtat tcatgatcaa ccattagata caaatgtgcc aactgataaa 660 
t'cagcaaacc tcgtctcgac aacacaaaaa agtacggata atcaacaagt taagtctaca 720 
gaaacatctc atcttcaaga aatcaacggt aaaacctatt ttcttgacga caatggtcaa 780 
gtraaaaaga acttcaccgc tattattgac ggtaaagttc tatactttga taaaacatcc 840 
ggcgaattga ccgcaaatgc accgcaagtt actaagggat tagtaaatat tgataatgca 900 
cataacgcgc ctcatgatct cacagctgat aacttcacaa atgtcgatgg ttacttaaca 960 
gctaacagtt ggtatcgtcc taaggacatc ttaaaaaacg gaacgacctg gacaccaaca 1020 
acsgcagsag aLtttcgacc attgctcatg tcttggtggc cggataagaa tacgcaggta 1080 
gcttatctac astatatrgca atcagttggt atgctacctg acgatgttaa agtatcaaat 1140 
gatgataata tgagcacatfc gactgatgct gctatgactg ttcaaaagaa tatcgaatcg 1200 
cgaattggtg tatctggaaa aactgattgg ctcaagcaag aratgaacaa actgattgat 1260 
tcacaggcaa actggaatat tgatagtgaa tcaaagggta atgatcattt acagggtggg 1320 
gcattg-tat atgtgaatga tgacaaaaca cctaacgcga actcagatta ccgtctgtta }380 
oaccctacac caaccaacca aaccggccaa attactgatc caagtaaaca aggtggatat 1440 
gagatgtzat taactaatga tgctgataat tctaaccctg ttgtacaagc tgagcaattg 1500 
aactgqcttc actacatgat gaacattggt actatagctc agaacgaccc aacagctaat 1560 
tttgacggtt atcgtgttga tgcggttgat aacgttgatg ccgatctctt acaaattgct 1620 
ggtgattact ttaaagctgc atacggtact ggtaaaactg aggcaaacgc aaacaatcat 1680 
atttcgatct tggaagattg ggataataat gattctgcgt acattaaagc ccacgggaat 1740 
a:6ccaattqa caatggattt tccagcacac ctggctttga aatscgcctt gaacatgcct 1800 
cttgccgcac aaagtggcct agaaccgcta attaatacaa gtcttgttaa gcgtgggaaa 1860 
gatgccacag aaaatgaagc acaaccaaac tatgccttta tccgtgccca tgatagtgaa 1920 
gtgcagaccg ttatLgcaca aattattaag gataaaatta acacaaaatc agacggctta 1980 
actgtaacac cagatgagat taagcaagct ttcactattt acaacgccga tgaattaaaa 2040 
gcagataagg aatatacagc atacaatatt cctgcttctt acgctgtatt gttgacaaac 2100 
aaggatactg tgccacgtgt ttattatggt gatctatttt ctgatgatgg acagtatatg 2160 
tcacagaagt caccatacta tgacgccatt acgtcacttt tgaaaagccg tatcaaatat 2220 
gtrtgctggcg gtcaaagtat gaatatgacg tacttgcatg agtgctttga tccagcaaaa 2280 
aatgagacaa agccacaagg cgtcttaaca tcagtacgtt acggtaaaqg tgcgatgacg 2340 
gccgacgatt tgggtaatag tgacacacgt caacaaggta ttggttrggt g^ttaataat 2400 
aagccattct tgaatttaaa tgatgatgaa caaattgtgc tcaatatggg tgctgctcac 2460 
aaaaatcaag cttaccgacc acttatgttg acaacaaaat ctggtcttca aatttacgat 2520 
aaggatgccg gagcgccagt tgtrtatact aacgatgctg gtcaacttat ttttaagtca 2580 
gatatggtct atggtgtcag caatccacag gtatctggtt attrtgctgc atgggtacca 264 0 
gtcggtgcga gtgatagtca agatgctaga acacaaagca gccagtcaiga aactaaggat 2700 
ggcgatgtct atcactr^taa tgctgcgcrt gattctaacg tgatttatga aggcttctcg 27C0 
aatttccaag caatgcctga aaagaatgat gacttcacca acgtaaaaat tgctcaaaat 2820 
gctaaattgt ttaaagattt agggattaca agctttgaat tagcaccgca atatcgttca 2880 
agtacagata atagtttttr ggattcggtt atccaaaacg gctatgcctt tactgatcga 2940 
tatgatgttg gctataatac gccaacaaaa tatggtacag ttgatcaact tctagatagt 3000 
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ctaagagcat tacacccaca aggtattcag gctattaatg actgggtacc tgatcaaatt 3060 
tataatttac ctggcgaaca aatcgtcacc gcagttcgta caaatggttc aggtaagtac 3120 
gattatgatu cagtgattaa taacacgctc tatgattcac gaacagttgg gggcggcgaa 3180 
taccaagaaa agttcggtgg cctgttctta gaccagttga aaaaagatta tcctagcttg 3240 
tttgaaacta agcagatatc* aacgaatcag ccgatgaatc cggatgttaa aattaaagaa 3300 
tggtctgcaa agt^actttaa" tggttc^aac attcaaggtc gtggcgcttg gtatgtactt 3360 
aaagactggg caacaaatca' atatttcaat gtgtctagtg ataatggatt cttgcctaaa 3420 
cagttactgg gtgaaaaaac aagcaccggc tttataacag aaaatggtaa gacttctttc 34 80 
tactcaacaa gtgqttatca" agctaaagat acctttattc aagatggaac aaattggtat 3540 
tactttgata atgcaggcta tatgttgaca ggtaaacaaa atatccacga taaaaattat 3600 
tatttcttac ctaatggtgt- ggaacttcaa gatgcttacc tttttgatgg taatca^gaa • 3660 
ttttactata ataaagctgg ggaacaagtt atgaaccagt attatcaaga tagtcaaaat 3720 
caatggcatt atttcrttga aaatggtcgc atggcaattg gcctgacaga agttccgaac 3780 
gctgatggca cccatgttac.-; acaatatttt gatgctaatg gtgtccaaat taaaggcaca 3840 
gctataaaag atcagaataa' tcaattacgc tattttgatg aggccacagg taatatggtg 3900 
gttaattcat ggggacagtt: agcagataag tcttggcttt accttaatgc acaaggcgtt 3960 
gctgtgactg gtaaccaaaa aattgatggt gaagagtact acttcaatgc tgatggtaag 4020 
caagttaaag gcaatqcaat. catcgataat aatggtgatc aacgttatta tgatggtgat 4080 
aagggtgtca tggtagttaa' ttcatggggt gagttgccag atggctcatg gttatatttg 4140 
aatgacaaag gtattgctgt. aacaggccgt caagtcatta ataatcaagt taatttcttt 4200 
ggtaatgatg gtaagcaaat." caaagatgcc tttaaattat tatccgatgg ttcatgggtg 4260 
tatttggatg ataagggcct- gataacaact ggagccaaag ttatcaatgg tctaaatatg 4320 
ttttttgata aagacggtca; tcaaatcaaa ggtgatgcca gcacggatgc caatggtaag 4380 
cgccattatt atgacaaaaa" tgatggtcat cttgtcacaa attcatgggg tgagttgcca 444 0 
gatggttcat ggttatatct agaagaacaa ggtgatgctg ttactggtca acgtgtgatt 4 500 
gatggcaaga cacgctattt tgatgaagat ggcaaacaaa ttaaaaatag cctaaaaacg 4 560 
ctggccaatg gcgataagat ttatcttgat ggtgatgggg ttgctgcaac aggcttacaa 4 620 
catgtgggcg ataaaatcat gtattttgat gaagatggca aacaagttgt tggcaagttt 4 680 
gtatcagcaa aagatggttc atggtattac ttaaatcagg atggtgttgc cgcggttggt 4 740 
ccaagcagca ttaatggaca atcactttac tttgatcaag atggtaaaca agttaaatat 4800 
aatgaagttc gtaatagtga tggaacaacc aactattaca caggattaac gggtgaaaag 4860 
ttaacgcaag acttcggtga actaccagat ggttcatgga tttatcttga tgcgcaaggt 4 920 
catacagtaa ctggtgcaca aatcattaac ggtcaaaatc tttactttaa ggctgacggc 4 980 
cagcaagtta aaggtcatgc ttatactgac caattaggtc atatgcgttt ttatgatcct 5040 
gattcaggtg atatgttgag taatcgcttt gaacaaatca cacctggtgt atgggcttac 5100 
tttggtgctg atggtgtggc cataactgga caacatgaca taaatggtca gaagctattc 5160 
tttgatgaga caggatatca agttaaaggt tcgcaacgta caatagatgg tacgttatac 5220 
agcttcgatt ctcaaactgg taaccaaaaa cgcgtacaga caacattgtt gccacaagca 5280 
ggtcactata tcacgaaaaa tggtaacgat tggcagtatg ataccaatgg tgaactagcg 5340 
aagggtctgc gtcaagatag caatggtaag ttgcgttact ttgatttgac aaccggcata 5400 
caagcgaaag gccaatttgt: tacaattggc caagaaactt attactttag taaagatcac 54 60 
ggggaitgcgc agttattgcc* aatggtcact gaagggcatt acggtacaat aacactcaag 5520 
caaggtcaag- acaccaaaac agcctgggtt taccgtgatc aaaataatac tattttgaag 5580 
ggattgcaaa atatcaatgg' cacgttgcaa ttctttgatc catatacagg tgaacaactt 5640 
aagggtggcg tagcaaagta/ tgacgacaag ctcttttact ttgaatcagg taaaggtaat 5700 
cttgttagca ccgtagcag^ tgactatcag gatggtcatt atatttccca agatggccaa 5760 
acacgttacg cagataagca; aaatcagctt gtaaagggac ttgttactgt taatggggca 5820 
ttacaatact ttgataacgc" tactggtaac caaataaaaa atcaacaagt tattgttgat 5880 
ggcaagacgt actattttga* cgataaaggc aatggtgaat adttattcac taatacatta 594 0 
gatatgtcta ctaatgcttt ttctaccaaa aatgttgcat tcaatcatga cagtaqcagt 6000 
ttcgaccata ctgttgatgg. Qttcttgacg gcagatactt ggtatcgacc aaagtcaatt 6060 
ttggctaacg ggacaacttg gcgtgattcg actgataagg atatgcgacc attaatcact 6120 
gtttggtggc caaataagaa tgttcaagtc aactacctca acttcatgaa agcaaatggc 6180 
ttgttgacaa cagcagcaca atacacacta cattcagatc aatatgattt gaacca*agct 6240 
gcacaagatg ttcaagtggc- cattgaaagg cgcattgcgt cagagcatgg cacagactgg 6300 
ttacagaaat tgttgtttga atcacaaaat aataacccat catttgtgaa gcaacaattc 6360 
atttggaaca aggattctga atatcatggt ggtggtgatg cttggttcca aggtggttat 6420 
ctgaagtatg gcaataaccc* actcacacca acaactaatt ctgattatcg tcaacctggt 6480 
aatgcatttg atttcttgct agccaacgac gtggataatt ctaatcctgt tgtgcaagct 6540 
gaaaacttaa actggttaca ttacttaatg aactttggca ccatcactgc gggtcaagat 6600 
gacgctaatt ttgatagtat tcgtattgac gctgtcgact ttattcataa tgatacaatc 6660 



15. 




csflcqractt axigattfitcr t Cvjigstgct tatcaaqtgc aacaaagtga agccaaagca 6720 
aaccotjcaca fctcatcggt r.gtiogct.ggc ttagacgcag gtacatcaac gattcataat 6760 
gaLgcqttaa ttgagtcaaa cctccgtgaa gcagcgacat tgtcgttaac aaatgaacct 68«30 
qgtodaaata aaccattgac gaatatgcta caagacgttg acggcggtac gcttatcacc 6900 
gaccanacgc agaatagtac agaaaatcag gcgacaccaa actattcaat tattcacgcg 6960 
cacgataaag gtgtgcaaga aaaagtaggt gcagccatta ctgatgctac tggtgctgat 7020 
tggacgaact ttacagatga acagttaaaa gccggattag agctattcta taagqatcag 7080 
cqcgcaacas ecaaaaagta taatagttat aacataccaa -gtatttatgc cctgatgttg 7140 
acaaacaaag atactgttcc tcgtatgtat tatggggata tgtatcaaga tgacggacag 7200 
tatatggcaa acaagagtat ctactatgat gccttagtgt cattaatgac ggctcgtaaa 7260 
agcLatgtca gcggtggtca aactatgagt gttgacaatc atggtfctgtt gaagagtgtc 7320 
cgttttggaa aagalgcgat gacagctaat gatttaggta catcagctac gcgtactgag 7380 
ggtcttggtg tcattattgg taatgatcca aagttgcaac ttaatgattc ggataaagtg 7440 
acactggata tgggtqcagc acatsaaaat caaaagtatc gcgcagttat cttaacaaca 7500 
cgt-qatggtt tggcaacctt taattcaqat caagcaccaa cagcttggac asacgatcaa 7560 
qqaacgttae cattctcaaa tcaagagatt aacgggcaag acsr^tracaca aattcgtggt 7620 
gttgctaatc cqcaaghttc tggttatcta gctgtttggg tgcctgtggg tgcatcagac 7680 
aatcaagatg cccgtacagc agcaacgaca acagaaaatc atgatggtaa agtattacac 7740 
tcgaatgcqq cattogottc taaccttatt tatgaaggtt tctctaactt ccaacctaag 7800 
gcaacaacgc atgatgaact tacgaacgtt gtaattgcta aaaatgccga tgtcttcaat 7860 
aattggggta ttacgagttr tgaaatggca ccacagtacc gttcaagtgg ggaccataca 7920 
ttcttggatt caacgattga taatggttat gccttcactg atcgctatga cttaggtttc 7980 
aatacaccaa caaegtatgg cactgatggi: gatttgcgtg caacgattca agcgctacat 8040 
catgctaata tgcaagttat ggctgacgtt gttgataacc aggtctataa crtacctggt 8100 
aaagaagttg tttcagcaac acgagcaggt gtttatggta atgacgacgc cacgggcttt 8160 
ggaacgcaac tctatgtgac taactccgtt ggtggtggtc aataccaaga gaaatatgct 8220 
ggacaatact tagaagctct gaaagcaaag tatccagacc tctttgaggg taaggcctat 8280 
gattattggt ataagaacta tgcaaatgat qggtcaaatc cttactatac attgtcacac 83^0 
ggtgaccqtq aatctatccc agcagatgtt gctattaagc aatqgtcagc taagtatatg 8400 
aacggcacga acgttttggg caatggtatg ggttatgtat tgaaggattg gcataatggt 8460 
caatatttca agcttgatqg rgataaatca acattacctc aaattt 8506 



<21C> 5 
<211> 8931 
<212> ADN 
<2i3> Gene dsr-E 

<'100> 5 

aataatctgt ctccattgct ttcaaaataa 
atattctatt tatattcact attgaatatc 
ttLgggttat acaatgastt qqtaaaggtt 
tattttttct aaaattaccg aact.igagga 
catgagggta atttgtgacc gtaaaaaart 
cggtattTitt gctttgatga tgtttggcgt 
tgcagttgac acgaarcata gccgtacttc 
ggttaatgat gacaagacta ctttaggagc 
agcgacaccg gtagcagata aaacagtaag 
aacgtcatca acgacacctg caacggataa 
agcagataag gcagtagata caacgccaac 
aacgccaacg acacctgcag caaataaagc 
agataaggcg gLagccacgc cagccacacc 
tgcaacggac aaggcagtag ccacaacgcc 
cacgagtagt attcatgatc aaccattaga 
cctcgtctcg acaacacaaa aaagtacgga 
trcatcttcaa gaaatcaacg qtaaaacctc 
gaacttcacc gctattatTiq acggtaaagt 
gaccgcaaat gcaccgcaag ttoctaaggg 
ggctcatgat ctcacagctg ataacttcac 
ttggtatcgt cctaaggaca tcttaaaaaa 



taatagttaa txattatcat ggaacaatca 60 
cttttttgca taaatctcta gagccgattc 120 
aatcattttt acaaaaccat ggtggttttt 180 
agagaaaagg agcaatagtt gtat;gagaga 240 
gtacaaatcg ggcaaagtac tagtaacagc 300 
cacaactgct agtgttagtg caaatacgat 360 
agcacagatt aataagagtg ccgttgataa 420 
ggcaaaagta gtggcagtag ccacaacgcc 480 
tgcacccgca gcagataagg cagtagatac 5^0 
ggcagtagat acaacgccaa cgacacctgc 600 
gacacctgca gcagataagg cagtagatac 660 
agtagataca acgccagcga ccgctgcaac 720 
tgcagcagat aagctagcaa atacgacgcc 780 
agcgacgccg gtagcaaata aagcagcaga 840 
tacaaatgtg ccaactgata aatcagcaaa 900 
taatcaacaa gttaagtcta cagaaacatc 960 
ttttcttgac gacaatggtc aagttaaaaa 1020 
tctatacttt gataaaacat ccggcgaatt 1030 
attagtaaat attgataatg cacataacgc 1140 
aaatgtcgat ggttacttaa cagctaacag 1200 
cggaacgacc tggacaccaa caacagcaga 1260 
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agattttcga ccattgctca tgtcttggtg 
acaatatatg caatcagttg gta.tgctacc 
ta'tgagcaca ttgactgatg ctgctatgac 
tgtatctgga aaaactgatt ggc.tcaagca 
aaattggaai: attgatagtg aatcaaaggg 
atatgtgaat gatgacaaaa cac'ctaacgc 
accaaccaac caaaccggcc aaattactga 
attagctaat gatgttgata attctaaccc 
tcactacatg atgaacatTig gtactatagc 
ttatcgTigtt gatgcggttg ataacgttga 
ctttaaagct gcatacggta ctggtaaaac 
cttggaagat tgggataata -atgattctgc 
gacaatggat tttccagcac acttggcttt 
acaaagtggc ctagaaccgc taattaatac 
agaaaatgaa gcacaaccaa actatgcctt 
cgttattgca caaattatta aggktaaaat 
accagatgag attaagcaag ctt.tcactat 
ggaatataca gcatacaata ttcctgcttc 
tgtgccacgt gtttattatg gtg'atctatt 
gtcaccatac tatgacgcca ttatgtcact 
tggtcaaagt atgaatatga cgtacttgca 
aaagccacaa ggtgtcttaa catcagtacg 
tttgggtaat agtgacacac gtcaacaagg 
cttgaattta aatgatgatg aacaaattgt 
agcttaccga ccacttatgt tgacaacaaa 
cggagcgcca gttgtttata ctaacgatgc 
ctatggtgtc agcaatccac aggtatctgg 
gagtgatagt caagatgcta gaacacaaag 
ctatcattca aatgctgcgc ttgattctaa 
agcaatgcct gaaaagaatg atgacttcac 
gtttaaagat ttagggatta caagctttga 
taatagtttt ttggattcgg ttatccaaaa 
tggctataat acgccaacaa aatatggtac 
attacacgca caaggtattc aggctattaa 
acctggcgaa caaatcgtca ccgcagttcg 
ttcagtgatt aataacacgc tctatgattc 
aaagtttggt ggcctgttct tagaccagtt 
taagcagata tcaacgaatc agccgatgaa 
aaagtacttt aatggttcaa acattcaagg 
ggcaacaaat caatatttca atgtgtctag 
gggtgaaaaa acaagcaccg gctttataac 
aagtggttat caagctaaag atacctttat 
taatgcaggc tatatgttga caggtaaaca 
acctaatggt gtggaacttc aagatgctta 
taataaagct ggggaacaag tta1:gaacca 
ttatttcttt gaaaatggtc gcertggcaat 
cacccatgtt acacaatatt ttgratgctaa 
agatcagaat aatcaattac gctattttga 
atggggacag ttagcagata agtcttggct 
tggtaaccaa aaaattgatg gtgaagagta 
aggcaatgca atcatcgata ataatggtga 
catggtagtt aattcatggg gtgagttgcc 
aggtattgct gtaacaggcc gtcaagtcat 
tggtaagcaa atcaaagatg cctttaaatt 
tgataagggc ctgataacaa ctggagccaa 
taaagacggi: catcaaatca aaggtgatgc 
ttatgacaaa aatgat:ggtc aticttgtcac 
atggttatat ctagaagaac aaggtgatgc 
gacacgctat tttgatgaag atggcaaaca 
tggcgataag atttatcttg atggtgatgg 
cgataaaatc atgtattttg atgaagatgg 



gccggataag aatacgcagg tagcttatct 1320 
tgacgatgtt aaagtatcaa atgatgataa 1380 
tgttcaaaag aatatcgaat cgcgaattgg 1440 
agatatgaac aaactgattg attcacaggc 1500 
taatgatcat ttacagggtg gggcattgtt 1560 
gaactcagat taccgtctgt taaaccgtac 1620 
tccaagtaaa caaggtggat atgagatgtt 1680 
tgttgtacaa gctgagcaat tgaactggct 17 4 0 
tcagaacgac ccaacagcta attttgacgg 1800 
tgccgatctc ttacaaattg ctggtgatta 1860 
tgaggcaaac gcaaacaatc atatttcgafc 1920 
gtacattaaa gcccacggga ataaccaatt '1980 
gaaatacgcc ttgaacatgc ctcttgccgc 2040 
aagtcttgtt aagcgtggga aagatgcca-'c 2100 
tatccgtgcc catgatagtg aagtgcagac -2160 
taacacaaaa' tcagacggct taactgtaac? 2220 
ttacaacgcc gatgaattaa aagcagataa 2280 
ttacgctgta ttgttgacaa acaaggatac 2340 
ttctgatgat ggacagtata tgtcacagaa 2400 
tttgaaaagc cgtatcaaat atgttgctgg 24 60 
tgagtgcttt gatccagcaa aaaatgagac 2520 
ttacggtaaa ggtgcgatga cggctgacga 2580 
tattggtttg gtgattaata ataagccatt 2640 
gctcaatatg ggtgctgctc acaaaaatca 2700 
atctggtctt caaatttacg ataaggatgc 2760 
tggtcaactt atttttaagt cagatatggt 2820 
ttattttgct gcatgggtac cagtcggtgc 2880 
cagccagtca gaaactaagg atggcgatgt 2940 
tgtgatttat gaaggcttct cgaatttcca 3000 
caacgtaaaa attgctcaaa atgctaaatt 3060 
attagcaccg caatatcgtt caagtacaga 3120 
cggctatgcc tttactgatc gatatgatgt 3180 
agttgatcaa cttctagata gtctaagagc 3240 
tgactgggta cctgatcaaa tttataattt 3300 
tacaaatggt tcaggtaagt acgattatga 33 60 
acgaacagtt gggggcggcg aataccaaga 34 20 
gaaaaaagat tatcctagct tgtttgaaac 34 80 
tccggatgtt aaaattaaag aatggtctgc 3540 
tcgtggcgct tggtatgtac ttaaagactg 3600 
tgataatgga ttcttgccta aacagttact 3660 
agaaaatggt aagacttctt tctactcaac 3720 
tcaagatgga acaaattggt attactttga 3780 
aaatatccac gataaaaatt attatttctt 3840 
cctttttgat ggtaatcaag aattttacta 3900 
gtattatcaa gatagtcaaa atcaatggca* 3960 
tggcctgaca gaagttccga acgctgatgg 4 020 
tggtgtccaa attaaaggca cagctataaa 4 080 
tgaggccaca ggtaatatgg tggttaattc 4140 
ttaccttaat gcacaaggcg ttgctgtgac 4200 
ctacttcaat gctgatggta agcaagttaa 4260 
tcaacgttat tatgatggtg ataagggtgt 4320 
agatggctca tggttatatt tgaatgacaa 4380 
taataatcaa gttaatttct ttggtaatga 4440 
attatccgat ggttcatggg tgtatttgga 4500 
agttatcaat ggtctaaata tgttttttga 4560 
cagcacggat gccaatggta agcgccatta 4 620 
aaattcatgg ggtgagttgc cagatggttc 4680 
tgttactggt caacgtgtga ttgatggcaa 4740 
aattaaaaat agcctaaaaa cgctggccaa 4800 
ggttgctgca acaggcttac aacatgtggg 4860 
caaacaagtt gttggcaagt ttgtatcagc 4920 
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aDr;ag3tvj=t tcot.vjgicii;!: acLt^outoa gqatggtgtt gccgcggttg gtcrcaagcsg 4980 

C3r.^.*lt^^gs^? costcactct .^-^tttgatca agatggtaaa caagttaaat ataatgaagt 5040 

tcgtaatagt gatqgaacaa ccaactatta cacaggatta acgggtgasa agt.taacgca 5100 

agacttcggt. gaacCaccaq atggttcatg gatttatctt gatgcgcaag gtcatacagt 5160 

aactrggtgca caaatcwtta acggtcaaaa tctttacttt aaggctgacg gccagcaagt 5220 

taaaggtcat gcttatactg accaattagg tcatatgcgt ttttatgatc ctgattcagg 5280 

tgatatgctg agtaatcgct ttgaacaaat cacacctggt gtatgggctt actttggtgc 5340 

tgatggtgtg gccataactg gacaacatga cataaatggt cagaagctat tctttgatga 5400 

gacaggatat caagttaaag gctcgcaacg tacaatagat ggtacgttat acagcttcga 5460 

ttctcaaact ggtaaccaaa aacgcgtaca gacaacattg ttgccacaag caggtcacta 5520 

tatcacgaaa aatggtaacq attggcagta tgataccaat ggtgaactag cgaagggtct 5530 

gcgtcasgat agcaatggta agttgcgtta ctttgatttg acaaccggca tacaagcgaa 564P 

aggccaatrt gttacaattg gccaagaaac trattacttt agtaaagatc acggggatgc 5700 

gcagtt2ztG ccaatggtca ctgaagggca ttacggtaca ataacactca agcaaqgcca 57 60 

agacacc^iar- acagcctggg tttaccgtga tcaaaataat actattttga agggattgca 5820 

aaataccaat rrgcargttgc aattctttga tccatataca ggtgaacaac ttaagggtgg 5B80 

cgtagcaaag tatgaL-gaca agctctttta ctttgaatca ggtaaaggta atcttgttag 5940 

caccgtagca ggtgac;tat:c aggatggtca ttatatttcc caagatggcc aaac^cgtta 6000 

cgcageraao caaaatcagc ttgtaaaggg acttgttact gttaatgggg cattacaata 6060 

ctttgar.aac gctactggta accaaataaa aaatcaacaa gttattgttg atggcaagac 6120 

gtactatttt gacgataaag gcaatggtga atacttattc octaatacat tagatatgtc 6180 

tactaatgct ttttctacca saaatgttgc attcaatcat gacagtagca gtttcgacca 6240 

tactgttcat ggcttcttga cggcagatac ttggtatcga ccaaagtcaa ttttggctaa 6300 

cgggacaact tggcctgatc cqactgataa ggatatgcga ccattaatca ctgtttggtg 6360 

gccsaataag aacqttcaag tcaactacct caacttcatg aaagcaaatg gcttgttgac 6420 

aacagcagca caatacacac tacattcaga tcaatatgat ttgaaccaag ctgcacaaqa 64 80 

tgttcaagtg gccattgaoa ggcgcattgc gtcagagcat ggcacagact ggttacagaa 6540 

attattgttt gaatcacaaa ataataaccc atcabttgtg aagcaacaat tcatttggaa 6600 

caaqgattct qaatatcatg gtggtggtga tgcttggttc caaggtggtt atctgaagta 6660 

tggcaatnac ccactcacac caacaactaa ttctgattaL cgtcaacctg gtaatqcatt 6720 

tgatt-Lcttg ctagccaacg acgtggataa ttctaatcct gttgtgcaag ctgaaaactt 6780 

aaactggtra csctacttaa tgaactttgg caccatcact gcgggtcaag atgacgctaa 684 0 

ttttgatagt attcgrattg acgctgtcga ctttattcat aatgatacaa tccaacgtac 6900 

ttatgattar cttcgtgatg cttarcaagt gcaacaaagt gaagccaaag caaaccagca 6960 

catrtcactg gtrgaagctg gcttagacgc aggtacatca acgattcata atgatgcgtt 7020 

aatzgagcca aacctccgtg aagcagcgac attgtcgtta acaaatgaac ctggtaaaaa 70S0 

taaaccatcg acgaatatgc tacaagacgt: tgacggcggt acgcttatca ccgaccatac 7140 

gcagaatagt acagaaaatc aggcgacacc aaactattca attattcacg cgcacgataa 7200 

aggrgtgcaa gaaaaagtag gtgcagccat tactgatgct actggtgctg attggacgaa 7260 

ctttacagat gaacagttaa aagccggatt agagctattc tataaggatc aqcgcgcaac 7320 

aaacaaaaag tataatagtt ataacatacc aagtatttat gccctgatgt tgacaaacaa 7380 

agatactgtt cctcgtatgt attatgggga tatgtatcaa gatgacgqac aqtatatggc 7440 

aaacaagact atctactatg atgccttagt gtcattaatg acggctcgta aaagctstgt 7500 

cagcggtggt caaactatga gtgttgacaa tcatggtttg ttgaagagtrg tccgtrttgg 7560 

aaaagatgcg atgacagcta atgatttagg tacatcagct acgcgtactg agggtcttgg 7620 

tgtcattatt ggtaatgatc caaagttgca acttaatgat tcggataaag tgacactgga 768Q 

tatgggtgca gcacataaaa atcaaaagta tcgcgcagtt atcttaacaa cacgtgatgg 7740 

tttggcaacc tttaattcag atcaagcacc aacagcttgg acaaacgatc aaggaacgtt 7800 

aacattctca aatcaagaga ttaacgggca agacaataca caaattcgtg gtgttgctaa 7860 

tccgcaagtt Lctggttatc tagctgtttg ggtgcctgtg ggtgcatcag acaatcaaga 7920 

tgcccgtaca gcagcaacga caacagaaaa tcatgatgqt aaagtattac actcgaatgc 7980 

ggcattagat tctaacctta tttatgaagg tttctctaac ttccaaccta aggcaacaac 8040 

gcatgatga^ cLUacgaacg ttgtaattgc taaaaatgcc gatgtcttca ataattgggg 8100 

tattacgagt ttt.qaaaLgg caccacagta ccgttcaagt ggggaccata cattcttgga 8160 

t-trcaacgatt qataatggtt atgccttcac tgatcgctat gacttaggtt tcaatacacc 8220 

aacaaagtat ggcactgatq gtgatttgcg tgcaacgatt caagcgctac atcatgctaa 8280 

tatgcaaatt atggctgscg ttgttgataa ccaggtctat aacttacctg gtaaagaagt 8340 

tgtttCrjgca anacgagcsq qtgtttatqg taatgacgac gccacgggct ttggaacgca 8400 

actctatgfcg actaactccg ttggtggtgg tcaataccaa gagaaatatg ctggacaata 8460 

cttagaagct ctgaaagcaa agtatccaga cctctttgag ggtaaggcct atgattattg 8520 

gtataagaac tatgcaaatg atgggtcaaa tccttactat acattgtcac acggtgaccg 8580 
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tgaatctatc 
gaacgttttg 
caagcttgat 
ttatcttatc 
tcgtctgtaa 
acaattgtca 



ccagcagatg 
ggcaatggta 
ggt gataaat 
aaattgtagt 
agctatgcta 
acacccacgg 



ttgctattaa 
tgggttatgt 
caacattacc 
gacaaaagtc 
taataacgtt 
•tattcgtggc 



gcaatggtca 
attgaaggat 
tcaaatttaa 
gcagatattg 
atgacaaaag 
gaagtgaaga 



gctaagtata 
tggcataatg 
tttattttga 
aatccaatat 
aaaattattt 
ttatggatat 



tgaacggcac 8640 
gtcaatattt 8700 
tagggaacga 8760 
ctgcgacttt 8820 
taaagttggc 8880 
c 8931 



<210> 6 

<211> 17 .. • . 

<212> PRT 
<213> Peptides 

<400> 6 • • • 

Ala Asn Trp Asn He Asp Ser Glu Ser Lys Gly Asn Asp His Leu Gin 
15 10 15 

Gly 



<210> 7 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 7 

Gly Gly Tyr Glu Met Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
1 5 * 10 15 

Val Val Gin Ala Glu Gin Leu Asn 
20 



<210> 8 
<211> 21 
<212> PRT 
<213> Peptides 

<400> 8 

Ala Asn Phe Asp Gly Tyr Arg Val Asp Ala Val Asp Asn Val Asp Ala 
1 ■ 5 ' 10 • -IS 

Asp Leu Leu Gin He 

20 . • • 



<210> 9 
<211> 12 
<212> PRT 
<213> Peptides 

<400> 9 

His He Ser He Leu Glu Asp Trp Asp Asn Asn Asp 
15 10 
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<:2Xl> 15 
<23;?> PRT 
<213> Peptid-ss 

<400> 10 

Tyr Ala Phe lie Arg ftla His Asp Ser Glu Val Gin Thr Val He 
15 10 15 



<210> 11 

<2Ii> 6 
<212> PRT 
<2n> Peptides 

<A0O> 11 

Asp Trp Val Pro Asp Gin He Tyr 
1 5 



<210> 12 
<211> 19 
<212> PRT 
<213> Peptides 

<400> 12 

Phe He Trp Asn Lys Asp Sor Glu Tyr His Gly Gly Gly Asp Ala Trp 
15 10 15 

Phe Gin Gly 



<210> 13 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 13 

Asn Ala Phe Asp Khc- Leu Leu Ala Asn Asp Val Asp Asn 3er Asn Pro 
15 10 15 

Val Val Gin Ala Glu Asn Leu Asn 
20 



<210> 14 
<211> 13 
<212> PRT 
<213> Peptides 

<^iO0> 14 

Ala Asn Phe Asp Ser He /urg 11c Asp Ala Val Asp Phe 
15 10 



20 




<210> 15 
<2il> 8 
<212> PRT 
<213> Peptides 



<400> 15 

His lie Ser Leu Val Glu Ala Gly 
1 5 



<2I0> 16 
<211> 8 
<212> PRT 

<213> Peptides '. 
<400> 16 

Tyr' Ser lie He His Ala His Asp 
1 5 



<210> 17 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 17 

Asp Val Val Asp Asn Gin Val Tyr 
1 5 



21 
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